UNIVERSITÉ LUMIÈRE LYON 2 FACULTÉ DE SCIENCES ÉCONOMIQUES ET DE GESTION

Dimension: px
Commencer à balayer dès la page:

Download "UNIVERSITÉ LUMIÈRE LYON 2 FACULTÉ DE SCIENCES ÉCONOMIQUES ET DE GESTION"

Transcription

1 UNIVERSITÉ LUMIÈRE LYON 2 FACULTÉ DE SCIENCES ÉCONOMIQUES ET DE GESTION Economie quantitative Master 2-ECOSMA Etudes et COnseil en Stratégie et MArketing Analyse des données Polycopié 1 : Méthodes factorielles Année Universitaire Courriel ; rafik.abdesselam@univ-lyon2.fr Web : Polycopiés :

2 PRESENTATION Description détaillée du cours 1. Analyse statistique des données uni-bidimensionnelles - Introduction aux méthodes de sondage - Les types de questions (fermée, ouverte-textuelle) - codage - Méthodes descriptives ( tris à plat - tris croisés - Tamis analyse bivariée) - Méthodologie et Techniques de dépouillement d enquête - traitements statistiques 2. Analyse statistique des données multidimensionnelle 2.1 Méthodes d'analyse factorielle - Analyse en Composantes Principales - Analyse Factorielle des Correspondances Simples - Multiples - Analyse Factorielle Discriminante - Analyse Discriminante Linéaire 2.2 Méthodes de classification automatique des données - Classification non hiérarchique : nuées dynamiques - Analyse et interprétation d une partition - Classification hiérarchique ascendante - descendante - Analyse Discriminante Barycentrique - Segmentation 2.3 Modélisation - Méthodes explicatives - Modèles de régression ( simple et multiple ) - Analyse de la variance ANOVA ( facteurs contrôlés avec ou sans interaction ) - Analyse de la covariance ANCOVA - Régression logistique 3. Analyse des données évolutives - Analyse factorielle multiple - Analyse conjointe de tableaux Objectifs Le but de ce cours est de donner aux étudiant(e)s une formation de base en traitement de données multidimensionnelles. Plusieurs techniques statistiques seront présentées et on insistera surtout sur la compréhension intuitive, l interprétation correcte et l utilisation pratique de celles-ci. Par conséquent, l emploi de concepts mathématiques sera réduit à son minimum et ces derniers ne serviront qu à facilité la compréhension des méthodes étudiées. Les méthodes les plus importantes sont présentées d une manière aussi concrète que possible, sans que soient trop développés ni les fondements mathématiques, ni les questions de calcul numérique. Le logiciel SPAD sera utilisé mais aucune connaissance préalable de celui-ci n est requise. Par contre, une connaissance des concepts et méthodes statistiques (population, échantillon, estimation, test d hypothèse) de base est requise. Chaque méthode est illustrée par des applications à des données réelles. L utilisateur doit évidemment avoir une idée suffisamment précise des principes généraux et des conditions d application de ces méthodes, mais il doit consacrer essentiellement son attention à la méthodologie d enchaînement de ces méthodes et à l interprétation des résultats obtenus. L analyse des données permet l étude d un problème dans sa globalité : multiplicité et interaction des critères, diversité de l environnement. Elle permet la description, l exploration, l analyse d importants tableaux de données. Bien adaptée aux études de terrain, c est en particulier l outil idéal des traitements d enquêtes. Les entreprises croulent littéralement sous le poids des données qu elles ont à leur disposition. Ces données contiennent potentiellement une quantité importante d informations pouvant être bénéfiques à l entreprise si utilisées correctement. Enfin, sous le vocable «Data mining» fouille de données, on retrouve différentes techniques statistiques utilisées pour explorer et analyser de grands ensembles de données. Ces techniques ont généralement pour but de développer des modèles prévisionnels, de réduire la taille des données, faire de la segmentation ou bien de découvrir des associations pertinentes. L analyse multidimensionnelle des données est à la base de plusieurs techniques de data maning et est utilisée dans plusieurs domaines de l économie et de la gestion dont le marketing. Approche pédagogique Sept séances de cours magistraux et de travaux dirigés (salle DE112 durée 3h) comprenant des exemples d application traités avec le logiciel SPAD. M2 : ECOSMA Analyse des Données - 2 -

3 MATERIEL PEDAGOGIQUE Ressources diverses (3) Polycopiés de cours, (1) polycopié de travaux dirigés ainsi que de nombreux fichiers de données réelles SPAD Système pour l Analyse de Données, version 7.4, Kit-Etudiant. Références bibliographiques Référence(s) de base [1] Bouroche J.M., Saporta G. L'analyse des données, "Que sais-je?" N 1854, PUF, 8 ème édition (2002). Ce fascicule de poche constitue une excellente introduction à l analyse statistique multidimensionnelle. Il met l accent sur l interprétation intuitive des idées et concepts en n ayant presque aucun recours à la notation mathématique. Il accorde aussi beaucoup d importance à l interprétation correcte des résultats. Autres références [2] Caillez F., Pages J.P. Introduction à l'analyse des Données SMASH (1975). [3] Celeux G, Diday E, Govaert G, Lechevalier Y, Ralambondrany H. Classification automatique des données. Environnement statistique et informatique, Dunod (1989). [4] Cibois P. L'analyse factorielle, "Que sais-je?" PUF (1983). [5] Cibois P. L'analyse des données en sociologie. PUF (1984). [6] Escofier B., Pagès J. Analyses factorielles simples et multiples 3 ème édition Dunod (1988). [7] Fenneteau H., Bialès C. Analyse statistique des données. Ellipses (1993). [8] Grangé D., Lebart L. Traitements statistiques des enquêtes. Dunod (1993). [9] Han J., Kamber M. : Data Mining Concepts and Techniques, (2001). [10] Michael J.A. Berry, Gordon Linoff : Data Mining, Masson (1997). [11] Moscarola J. Enquêtes et analyse de données. Vuibert Gestion (1990). [12] Rodriguez Herrera R., Salles-Le-Gac D. Initiation à l analyse factorielle des données Fondements mathématiques et interprétations. Ellipses (2002). [13] Saporta G. Probabilité, analyse des données et statistique Editions Technip (1990). [14] Stanton A, Glantz K, Bryan K : Primer of applied regression and anlysis of variance, Mc Graw Hill, (2000). [15] Volle M., Analyse des données. Economica (1978). [16] Guide du logiciel SPAD version 6 Système pour l Analyse des Données. Adresses de sites Web à consulter : [1] [2] [3] Cours C. Gourieroux, Econometric, Analysais of individual Risks [4] glossaire statistique CONTROLE DES CONNAISSANCES Examen terminal ( 100% ) - janvier - durée 1h 30 - salle informatique. M2 : ECOSMA Analyse des Données - 3 -

4 Préambule Ce cours vise à présenter les méthodes d'analyses de données en mettant l'accent sur les outils d'interprétation, sans écarter pour autant l'exposé des principes de fonctionnement. Ces méthodes d'analyse sont aisées à mettre en oeuvre depuis le développement des moyens informatiques puissants de calcul, mais leur interprétation est souvent délicate. On insistera donc sur leurs aspects intuitifs, à savoir leur principe général, leurs objectifs et les techniques d interprétation des résultats. De plus, chaque méthode est illustrée par des applications à des données réelles. Bien évidemment, avant d'effectuer ces méthodes d'analyses multidimensionnelles sophistiquées, il est recommandé de prendre contact avec les données au moyen des outils classiques de la statistique descriptive ou de ceux plus récents de la statistique exploratoire ( cf. Méthodologie et techniques de dépouillement d'enquête ). Les objectifs - mettre en évidence les principes de fonctionnement de ces méthodes sans recourir au formalisme mathématique (des ouvrages permettant d'approfondir les fondements mathématiques sont indiqués en bibliographie), - montrer à partir d'exemples réels comment interpréter les résultats de ces analyses, - donner une idée de l'intérêt mais aussi des dangers et limites de ces méthodes, - l'enchaînement canonique de ces méthodes dans le cadre d'une analyse structurelle des données d'enquête. Un peu d'histoire Les prémices de ces méthodes ont été mises en place dans la première moitié de ce siècle par les travaux de Pearson (1904) et Hotelling (1933), aboutissant à l'analyse en Composantes Principales (ACP, Principal Component Analysis, PCA, appelée aussi Factor Analysis dans certains logiciels) qui permet de traiter un tableau de variables quantitatives. Dans les années , divers travaux tentent de mettre au point une technique équivalente pour traiter des tableaux de contingence ( tableau croisé de deux variables qualitatives ) : on peut citer les modèles de l'américain Goodman. Un français, Benzecri, trouve le moyen d'appliquer les principes de l'acp à un tel tableau : c'est l'analyse Factorielle des Correspondances (AFC). Il assortit ses travaux de considérations épistémologiques sur l'inutilité des hypothèses probabilistes (qui sont à la base des statistiques classiques : test, etc..) dans le traitement des données. Il prône une approche fondée sur le refus de ces hypothèses qui se présente comme une alternative aux approches statistiques classiques (essentiellement d'origine anglo-saxonne) et prend le nom d'analyse de Données. A la suite de ces travaux, une sorte d'école se développe en France. Diverses techniques sont mises au point dans ce cadre : Analyse Factorielle des Correspondances Multiples ( AFCM ou ACM ) ; Analyse Factorielle Discriminante (AFD); Segmentation ; Méthodes des Nuées Dynamiques ; etc. A la fin des années 80 la querelle entre partisans de l'analyse de Données et statisticiens "classiques" s'est apaisée. Les premiers ont réintroduit des éléments de probabilités dans leurs techniques et les seconds ont fini par considérer que ces méthodes pouvaient parfois être utiles. Le «Data Mining» est apparu aux Etats-Unis au milieu des années Il désigne l ensemble des moyens d exploitation informatique «intelligente» des données utilisant des modèles de prédiction variés. La traduction en français la plus proche est «fouille de données». Il ne suffit pas d avoir les données, encore faut-il savoir les traiter pour les synthétiser, les analyser, les rechercher, les mettre en perspective d une action bien définie ou d un objectif à atteindre. C est ainsi que s introduit naturellement le Data Mining qui est essentiellement dû à la conjonction des deux facteurs suivants : M2 : ECOSMA Analyse des Données - 4 -

5 - l accroissement exponentiel, dans les entreprises, de données liées à leur activité (données sur la clientèle, les stocks, la fabrication, la comptabilité, la gestion, les ressources humaines, etc.). Les entreprises ont vite compris qu il serait dommage de jeter ces données car elles contiennent des informations-clé (connaissances) sur leur fonctionnement, ces connaissances s avérant stratégiques pour la prise de décision. - Les progrès très rapides des matériels et logiciels informatiques, permettant de stocker des données et de les analyser pour un coût de plus en plus faible, tout en gérant des volumes de plus en plus importants. L analyse statistique exploratoire des données nécessite beaucoup de calculs et est inutilisable sans moyens informatiques. Pour traiter ses données, le statisticien contemporain a le plus souvent recours aux grands logiciels très répandus SAS, SPAD, SPSS. Ces logiciels constituent des outils indispensables très puissants, voire de véritables environnements informatiques (SAS), permettant le traitement d'une grande variété de données. Introduction Plus de vingt-cinq années de pratique ont démontré la puissance des méthodes d'analyses de données ou techniques de statistique descriptive multidimensionnelle, pour acquérir de l'information synthétique sur des échantillons énormes ou les très grands ensembles de données complexes comme le sont les fichiers d'enquêtes. La souplesse des programmes de calcul et leur efficacité permettent d'y faire appel de façon répétée sur les mêmes données. Lorsqu on dispose d un volumineux fichier de données, il est difficile d appréhender globalement l information contenue. Les méthodes statistiques classiques sont insuffisantes. En effet, la statistique descriptive nous enseigne seulement comment dégager des pourcentages et comment représenter l intensité entre deux caractères, par exemple le PIB en fonction de la population d un ensemble de pays ; la statistique inférentielle (mathématique), quant à elle, permet d estimer des paramètres de distribution ( moyenne, variance, proportion, etc.) et de vérifier la validité d hypothèses, notamment si deux séries de données correspondent à deux caractères corrélés. Toutes ces méthodes ne permettent pas d extraire les informations d un grand fichier, d où l on veut, en dépistant des concomitances répétées, déduire les relations statistiques entres diverses caractéristiques. L analyse des données permet des études globales incluant toutes les caractéristiques de ces mêmes données ; ces études ont pour but de mettre en lumière les phénomènes importants en faisant le minimum d hypothèses a priori sur les importances relatives des informations. Aujourd hui, l analyse des données est devenue un outil indispensable dans de nombreux domaines, par exemple l aide à la décision, en finance, dans les études de marché ou dans l étude du risque. Les méthodes d'analyse de Données sont rangées en deux grandes familles : les méthodes d'analyse factorielle et les méthodes de classification automatique. Ces deux familles de méthodes ont pour objet de résumer l'information contenue dans les données. Elles sont plus complémentaires que concurrentes, et peuvent avec profit être utilisées conjointement sur un même tableau de données du type " individus ( objets ) x variables ( attributs )". On peut, dans certains cas, associer utilement une classification aux résultats d'une analyse factorielle. Les méthodes d'analyse factorielle constituent un domaine important de l'analyse des données et relèvent de l'analyse linéaire. Elles sont diverses de part leurs différents domaines d'applications, mais leurs arrièreplans mathématiques sont très proches. Les méthodes factorielles ont pour objet de résumer l'information apportée par un ensemble de variables, par un nombre plus restreint de variables nouvelles appelées "facteurs". Les méthodes de classification automatique porte sur l'ensemble des individus ( objets ) qu'il s'agit de regrouper en classes ou catégories jugées les plus homogènes possibles et cela au regard d'un critère. On distinguera les variables selon leur type : quantitatives ou qualitatives et selon leur fonction dans l'analyse : actives ou illustratives ( supplémentaires ). M2 : ECOSMA Analyse des Données - 5 -

6 1- Analyse en Composantes Principales 1-1 Généralités L'Analyse en Composantes Principales 1 (ACP) est une méthode statistique exploratoire permettent une description essentiellement graphique de l information contenue dans de grands tableaux de données. C est aussi une méthode de structuration et de synthèse de données numériques. Elle permet de présenter un résumé descriptif, accompagné de représentations graphiques, d'un ensemble d'observations mesurées sur un ensemble de variables numériques. On utilisera cette méthode lorsqu'il s'agira de décrire et de "visualiser" au mieux l'information contenue dans un tableau de données quantitatives où n individus ( objets ) ont été évalués en fonction de p variables ( attributs ou caractéristiques ). L'ACP est une méthode très efficace pour représenter des données corrélées entre elles. Elle est largement utilisée dans les études de marché, d opinion et, de plus en plus, dans le domaine industriel. 1-2 Présentation de la méthode Supposons que l'on analyse les variables PIB et Population d'un ensemble de pays. On peut construire un graphique représentant les individus ( 15 pays de UE ) : En présence de deux variables, il est facile de représenter, dans un plan, l'ensemble des données. L'allure du nuage de points permet, d'étudier l'intensité de la liaison "corrélation" entre ces deux variables, de situer les différents individus ( pays ) et éventuellement de les classer. Supposons que l'on dispose d'une troisième variable "Taux d inflation" : il devient alors difficile de tout avoir sur un graphique. Il faut recourir à la perspective ou faire deux graphiques ( PIB x Population et Taux d inflation x Population par exemple ). Rajoutons une quatrième variable Taux de croissance, voire une cinquième Taux de chômage, etc. La représentation graphique des données devient alors impossible. Or ces variables sont corrélées entre elles : elles sont donc partiellement redondantes. Question : peut-on déterminer un nombre restreint de variables, représentant les mêmes données et non corrélées entre elles? 1 Principal Component Analysis (PCA). M2 : ECOSMA Analyse des Données - 6 -

7 1-2 Objectif de la méthode L'ACP consiste à synthétiser le nombre de variables observées, autrement dit elle va tenter de résumer l'information contenue dans le tableau de données, en un ensemble réduit de combinaisons linéaires des variables initiales, en veillant à minimiser la perte d'information du fait de cette réduction. Ces nouvelles variables synthétiques appelées "composantes principales ou facteurs ou encore macro-caractéristiques" possèdent donc les propriétés suivantes : - les composantes principales, notées ( C 1, C 2,..., C q ), sont des combinaisons linéaires des variables initiales ( X 1, X 2,, X p ) : C j = a 1 X 1 + a 2 X a p X p pour tout j = 1,q avec q p. - elles sont non corrélées (les coefficients de corrélation linéaire des composantes prises deux à deux sont nuls) ce qui évite la redondance de l'information déjà résumée. - la première composante porte ou résume plus d'informations que la seconde qui en porte plus que la troisième et ainsi de suite, de sorte qu'en se limitant aux 2 ou 3 premières composantes on dispose d'un bon résumé de l'information contenue dans les données. En résumé, on peut dire que l ACP consiste à transformer les variables initiales corrélées en de nouvelles variables, les composantes principales, combinaisons linéaires des variables initiales non corrélées entre elles, de variance maximale et les plus liées aux variables initiales : l ACP est une méthode factorielle linéaire. Ainsi, on utilisera l ACP pour faire apparaître : - la structuration des variables actives, c est-à-dire les systèmes de relation qui existent entre elles ; leurs association ou leurs oppositions. - La répartition des individus les uns par rapport aux autres, en relation avec les variables traitées ; les individus qui présentent des caractéristiques communes ou antagonistes. A noter que l ACP est une méthode essentiellement descriptive, préalable à l emploi d autres méthodes statistiques, telles que les méthodes de classification, de régression ou encore d économétrie. Moyens mathématiques Les outils mathématiques utilisés sont ceux de l'algèbre linéaire et du calcul matriciel. Le principe est le suivant : Diagonalisation Matrice des corrélations > Matrice des valeurs propres X 1 X 2... X p C 1 C 2... C p X 1 1 r r 1p C X 2 r r 2p C X p r p1 r p C p p ( r 12 = r( X 1, X 2 ) coefficient de corrélation linéaire entre les variables X 1 et X 2 ) On diagonalise la matrice des corrélations 2 (matrice symétrique dont les éléments sont les coefficients de corrélation linéaire entre les variables initiales prises deux à deux) (*). - les vecteurs propres de cette matrice définissent les nouvelles variables recherchées; les composantes principales - les valeurs propres associées, sont les variances des composantes principales (l'information résumée par chacune des composantes). - les axes factoriels sont les droites engendrées par les vecteurs propres. On peut montrer que les composantes principales ainsi définies, vérifient bien les propriétés recherchées : non corrélées entre elles, de variance décroissante, combinaisons linéaires des variables de départ. Cette dernière propriété permet de construire des graphiques représentant les individus aussi bien que les variables dans l'espace défini par les composantes. 2 On ne traite ici que le cas le plus courant. Le cas général part de la matrice des variances-covariances et d'une matrice des poids qui peut varier. Ici on parle d'une ACP normée, les données sont centrées et réduites pour éliminer les effets de l'origine (moyennes) et des unités (variances) des variables. M2 : ECOSMA Analyse des Données - 7 -

8 1-3 Points à retenir - Matrice des corrélations : fournit des éléments de description des associations entre les variables actives. Sa lecture nous donne une première idée de l'intensité de la liaison linéaire entre les variables, mais l'analyse en composantes principales va permettre d'obtenir une synthèse de ces liaisons. - Somme des valeurs propres : représente la variance ( l'inertie, l'information ) totale à résumer. Elle est égale au nombre de variables dans le cas d'une ACP normée. - Valeur propre : la variance de la composante principale correspondante (l'information résumée par l'axe factoriel considéré). - Pourcentage : le rapport de la valeur propre à l'inertie totale, ce qui mesure la quantité de l'information résumée par l'axe factoriel correspondant. Variables et individus actifs : Interprétation interne Variables actives - Coordonnées : les coordonnées des variables initiales sur les axes factoriels engendrés par les composantes principales. - Corrélations variables-facteurs : coefficients de corrélations entre les variables actives initiales et les composantes principales; ce qui mesure la qualité de la représentation des variables dans les plans factoriels. Individus actifs - Coordonnées : les coordonnées des individus sur les axes factoriels - Contribution : mesure la qualité de représentation de l'individu sur l'axe factoriel considéré. C'est la part d'inertie ou d'information de l'individu à la détermination de l'axe factoriel correspondant - Cosinus carré : détermine la qualité de représentation de l'individu sur l'axe factoriel considéré. La qualité de la représentation d'un individu dans un plan est définie par la somme des cosinus carrés correspondant aux deux axes factoriels définissant le plan. Variables et individus supplémentaires : Interprétation externe Les éléments supplémentaires éventuels n interviennent pas dans les calculs de détermination des composantes principales ; par contre, ils sont très utiles a posteriori pour enrichir l interprétation de ces composantes. Variables supplémentaires On peut également représenter dans l'analyse, des variables mixtes ( quantitatives et/ou qualitatives ) supplémentaires ou illustratives. L'utilisation de ces variables qui n'ont pas participé à la détermination des axes factoriels apporte des éclairages différents, il s'agit alors d'une interprétation externe. - Les variables quantitatives illustratives se représentent aisément dans le cercle des corrélations à partir de leurs corrélations avec les composantes principales. - Quant aux variables qualitatives, on utilise en général le principe barycentrique qui consiste à faire figurer le centre de gravité ( point moyen ) de chaque modalité. Individus supplémentaires - On peut également projeter des individus supplémentaires, à partir de leurs coordonnées relatives aux variables initiales. N'ayant pas servi à la détermination des axes, les contributions des individus illustratifs sont nulles. M2 : ECOSMA Analyse des Données - 8 -

9 1-4 Qualité des représentations - Interprétation des résultats Les projections sur les plans principaux sont des représentations déformées de la réalité et il convient de prendre des précautions quant à l'interprétation des résultats. On peut décomposer la lecture des résultats d'une ACP en plusieurs étapes qui sont les suivantes : - L'histogramme des valeurs propres permet de vérifier la qualité du résumé sur les différents axes factoriels. Le nombre d'axes à retenir est un problème délicat et qui n'a pas de solution rigoureuse. Il n'y a pas de règle précise fixant un seuil à partir duquel on éliminerait l'analyse ou décidant du nombre d'axes à étudier ( en analyse des données, tout est affaire d'interprétation ). Souvent on tient compte de la forme de l'histogramme pour déterminer le nombre d'axes à interpréter : NUMERO POURCENT. HISTOGRAMME DES 4 PREMIERES VALEURS PROPRES CUMULE 2 axes factoriels ******************************************************************************** *************************************** ******* ** NUMERO POURCENT. HISTOGRAMME DES 4 PREMIERES VALEURS PROPRES CUMULE 3 axes factoriels ******************************************************************************** ************************************** ********************************* ******** Pour rester intéressants, les axes doivent fournir une information plus importante que chaque variable initiale. On peut également retenir les axes dont le taux d'inertie (exprimé en %) serait à peu près égal à 100/p, où p est le nombre de variables actives initiales. Dans le cas d'une ACP normée, on retient les axes factoriels dont la valeur propre est supérieure à un. En effet en données centrées-réduites les variables initiales ont des variances égales à un et on cherche des combinaisons linéaires de variance maximale donc supérieures. - Les corrélations variables-facteurs permettent de donner un sens aux axes factoriels et de vérifier la qualité de représentation des variables dans les plans factoriels. Si une variable n'est corrélée avec aucun des axes d'un plan, on ne peut guère tenir compte de cette variable dans ce plan. On s interessera aux coefficients les plus forts en valeur absolue et proches de 1. - les valeurs-tests : Si l'on projette les modalités de variables qualitatives illustratives, les valeurs-tests constituent un indice de la qualité de représentation de ces modalités sur les plans factoriels. On considère que si la projection d'une modalité sur un axe est due au hasard, elle réalise une loi normale centrée réduite. Si la valeur-test est supérieure à 1.96 en valeur absolue sur au moins l'un des deux axes, on considère que cette projection n'est pas due au hasard et que l'on peut en tenir compte. Autrement dit, la position de cette modalité ( catégorie ) illustrative, dans le plan factorielle, est significativement différente de l'origine. - les cosinus carrés : Lorsque l'on étudie la représentation des individus, les cosinus carrés entre individus et axes factoriels permettent de déterminer les individus qui sont bien ou mals représentés dans chaque plan. Le plus simple est de fixer arbitrairement un seuil (0.4, 0.5 ou plus) et de ne tenir compte, dans une première phase d'interprétation, que des individus dont le cosinus carré dépasse ce seuil, avant de réintégrer progressivement les autres. - contribution : On retiendra que les individus dont la contribution à l'axe factoriel est au moins égale à la moyenne des valeurs des contributions sur cet axe. - Le graphique des variables ( cercle de corrélations dans le cas d'une ACP normée ) permet de visualiser les proximités entre variables en terme de corrélation. C'est une synthèse graphique de la matrice des corrélations des variables actives : les directions des variables donnent le sens des corrélations. La distance par rapport au centre du graphique visualise la qualité de représentation dans le plan ( plus une variable est proche du centre, plus mauvaise est sa représentation ). M2 : ECOSMA Analyse des Données - 9 -

10 - Le graphique des individus permet de visualiser les proximités entre individus qui s'interprétent en terme de similitudes de comportement vis-à-vis des variables. L'étude de la forme du nuage des individus permettra de distinguer d'éventuels regroupements et de différencier des individus ou des groupes d'individus selon leurs réponses à l'ensemble des variables actives. Remarques : La superposition de ces deux graphiques ( variables - individus ) est dénuée de sens car ces nuages de points ne font pas partie d'un même espace. Bien qu il existe une manière de représenter simultanément individus et variables appelée «biplot», nous préconisons de représenter séparément les deux ensembles pour éviter des confusions. Si les graphiques sont ce que l'on regarde en premier le plus souvent, il faut tenir compte des divers indicateurs qui permettent d'éviter les pièges de l'interprétation de ce qui ne constitue qu'un résumé des données. Rappelons que les éléments supplémentaires n interviennent pas dans les calculs de détermination des axes factoriels ; par contre, ils sont très utiles a posteriori pour conforter et enrichir l interprétation de ces axes. L interprétation interne consiste à étudier les résultats en se basant sur les variables et les individus actifs. L étude des éléments supplémentaires se fait à travers la phase d interprétation externe. 1.5 Exemple d'application Données ( Principaux indicateurs économiques et financiers de UE-2000 ) On s'intérresse ici aux principaux indicateurs économiques et financiers des 15 pays de l Union Européenne. Source : Publication de la banque de France - 14 septembre Document disponible sur le site internet de la banque de France : ( En plus des variables caractéristiques de la population et du Produit Intérieur Brut, présentées dans le dictionnaire des variables, on distingue deux principaux thèmes ou groupes de variables continues. Le premier se réfère aux finances publiques, le second à l activité et l emploi. Le tableau suivant résument les principales variables retenues pour donner une description d ensemble des caractéristiques des 15 pays de l Union Européenne. Dictionnaire des variables Etat membre ( 3 MODALITES ) AUTR - Autre ZNEU - Zone Non Euro ZEUR - Zone Euro-EUM 2. Population (%) UE-2000 ( CONTINUE ) POPU - Population (%) UE Produit Intérieur Brut (%) UE-2000 ( CONTINUE ) PIB - Produit Intérieur Br Thème Finances publiques 4. Recettes totales des APU en % du PIB ( CONTINUE ) RECE - Recettes totales des 5. Dépenses totales des APU en % du PIB ( CONTINUE ) DEPE - Dépenses totales des APU 6. Solde des finances publiques en % du PIB ( CONTINUE ) SDFP - Solde des finances publiques 7. Dette brute des APU en % du PIB ( CONTINUE ) DETB - Dette brute des APU Thème Activité-Emploi 8. Taux de chômage en % population active ( CONTINUE ) TCHO - Taux de chômage en % 9. Ventes au détail en volume (%) ( CONTINUE ) VENT - Ventes au détail en 10. Production industrielle hors bâtiment ( CONTINUE ) PIND - Production industrie 11. Taux de croissance en volume du PIB ( CONTINUE ) TCRO - Taux de croissance e M2 : ECOSMA Analyse des Données

11 1.5.2 Résultats Dans cet exemple, l'objectif est de décrire les variables du thème finances publiques-2000 de l ensemble des 15 pays de l UE. A noter qu'on a considéré les variables continues du thème Activité-Emploi et la variable nominale Etat membre comme variables supplémentaires ainsi que les deux pays hors UE (Etats-Unis et Japon) comme individus supplémentaires. Les résultats numériques et graphiques sont les suivants : SELECTION DES INDIVIDUS ET DES VARIABLES UTILES VARIABLES NOMINALES ILLUSTRATIVES 1 VARIABLES 3 MODALITES ASSOCIEES Etat membre ( 3 MODALITES ) VARIABLES CONTINUES ACTIVES 4 VARIABLES Recettes totales des APU ( CONTINUE ) 5. Dépenses totales des APU ( CONTINUE ) 6. Solde des finances publiques ( CONTINUE ) 7. Dette brute des APU ( CONTINUE ) VARIABLES CONTINUES ILLUSTRATIVES 4 VARIABLES Taux de chômage en % population active ( CONTINUE ) 9. Ventes au détail en volume (%) ( CONTINUE ) 10. Production industrielle hors bâtiment ( CONTINUE ) 11. Taux de croissance en volume du PIB ( CONTINUE ) INDIVIDUS NOMBRE POIDS POIDS DES INDIVIDUS: Poids des individus, uniforme egal a 1. UNIF RETENUS... NITOT = 17 PITOT = SELECTION APRES FILTRAGE ACTIFS... NIACT = 15 PIACT = SUPPLEMENTAIRES... NISUP = 2 PISUP = M2 : ECOSMA Analyse des Données

12 ANALYSE EN COMPOSANTES PRINCIPALES STATISTIQUES SOMMAIRES DES VARIABLES CONTINUES EFFECTIF TOTAL : 15 POIDS TOTAL : NUM. IDEN - LIBELLE EFFECTIF POIDS MOYENNE ECART-TYPE MINIMUM MAXIMUM RECE - Recettes totales des DEPE - Dépenses totales des SDFP - Solde des finances p DETB - Dette brute des APU TCHO - Taux de chômage en % VENT - Ventes au détail en PIND - Production industrie TCRO - Taux de croissance e MATRICE DES CORRELATIONS RECE DEPE SDFP DETB RECE 1.00 DEPE SDFP DETB RECE DEPE SDFP DETB MATRICE DES VALEURS-TESTS RECE DEPE SDFP DETB RECE DEPE SDFP DETB RECE DEPE SDFP DETB VALEURS PROPRES APERCU DE LA PRECISION DES CALCULS : TRACE AVANT DIAGONALISATION SOMME DES VALEURS PROPRES HISTOGRAMME DES 4 PREMIERES VALEURS PROPRES NUMERO VALEUR POURCENT. POURCENT. PROPRE CUMULE ************************************************************ *************************************** *********** * COORDONNEES DES VARIABLES SUR LES AXES 1 A 4 VARIABLES ACTIVES VARIABLES COORDONNEES CORRELATIONS VARIABLE-FACTEUR ANCIENS AXES UNITAIRES IDEN - LIBELLE COURT RECE - Recettes totales des DEPE - Dépenses totales des SDFP - Solde des finances p DETB - Dette brute des APU M2 : ECOSMA Analyse des Données

13 Représentation des variables actives Finances publiques Cercle de corrélation COORDONNEES, CONTRIBUTIONS ET COSINUS CARRES DES INDIVIDUS INDIVIDUS ACTIFS (AXES 1 A 4) INDIVIDUS COORDONNEES CONTRIBUTIONS COSINUS CARRES IDENTIFICATEUR P.REL DISTO France Allemagne Autriche Belgique Espagne Finlande Grèce Irlande Italie Luxembourg Pays-bas Portugal Danemark Royaume-Uni Suède Représentation des individus actifs (pays UE-15) Premier plan principal M2 : ECOSMA Analyse des Données

14 VARIABLES ILLUSTRATIVES IDEN - LIBELLE COURT POPU - Population (%) UE PIB - Produit Intérieur Br TCHO - Taux de chômage en % VENT - Ventes au détail en PIND - Production industrie TCRO - Taux de croissance e Représentation des variables illustratives Premier plan principal INDIVIDUS ILLUSTRATIFS (AXES 1 A 4) INDIVIDUS COORDONNEES CONTRIBUTIONS COSINUS CARRES IDENTIFICATEUR P.REL DISTO Etats-Unis Japon COORDONNEES ET VALEURS-TEST DES MODALITES AXES 1 A MODALITES VALEURS-TEST COORDONNEES IDEN - LIBELLE EFF. P.ABS DISTO Etat membre AUTR - Autre ZNEU - Zone Non Euro ZEUR - Zone Euro Représentation des individus illustratifs sur le premier plan principal Modalités de la variable nominale Etat membre M2 : ECOSMA Analyse des Données

15 1.5.3 Quelques interprétations des résultats Les tableaux des statistiques sommaires et des corrélations des variables "finances publiques des 15 pays de l UE" nous fournissent les premières informations : - Statistiques descriptives ( moyenne, écart-type, minimum, maximum ) des variables actives et illustratives continues. - lorsque l'ordre de grandeur des variances des variables actives et/ou les unités de mesure de ces variables sont différentes, il est dès lors indispensable de normer les données c est-à-dire choisir une ACP normée. - la variable Recettes totales des APU 3 est fortement corrélée positivement avec la variable Dépenses totales des APU alors que la variable Solde des finances publiques est corrélée négativement avec la variable Dette brut des APU. La matrice des valeurs-tests présente les résultats des tests statistiques des coefficients de corrélation des variables actives. - Seuls les deux premiers facteurs significatifs de l analyse sont conservés. Les taux d'inertie expliquée correspondent à 55,16% et 34,77% de l'information globale représentée respectivement par le premier et deuxième facteur. Le plan constitué de ces deux facteurs principaux décrit environ 90% de l'information totale contenue dans les quatre variables actives initiales. Représentation graphique des variables finances publiques: Le graphique "cercle de corrélations" donne une représentation des caractéristiques finances publiques des 15 pays de l UE sur les deux premiers axes factoriels. Les données étant ici centrées réduites, les coordonnées de ces caractéristiques sur les axes sont les coefficients de corrélations entre les variables et les composantes principales. Ainsi, sur le premier plan principal, - le premier facteur est corrélé négativement avec les dépenses, les recettes et la dette brute des APU, et positivement avec le solde des finances publiques. - le deuxième facteur est significativement corrélé négativement avec le solde des finances publiques et les recettes, et positivement avec la dette brut des APU. Seule la variable illustrative "Taux de croissance en volume du PIB" du thème Activité-Emploi qui a été projetée a posteriori dans le plan factoriel, est corrélée avec le premier axe factoriel. Représentation graphique des individus ( pays de l UE-15 ) : L interprétation interne de la représentation des individus s effectue toujours à partir de celle des variables actives. Ainsi, relativement à l ensemble des pays de l UE et sur le premier plan factoriel, - le premier facteur oppose les pays dont les recettes, les dépenses et la dette brute sont élevées avec un solde des finances publiques significativement faible c est le cas de la Grèce, Suède, France ou encore de la Belgique, aux pays comme l Irlande et le Luxembourg dont le solde des finances publiques est élevé alors que les recettes, les dépenses et la dette brute sont significativement faibles. De plus, ces pays ont plutôt un taux de croissance en volume du PIB élevé par rapport à celui de l ensemble des pays de l UE ( interprétation externe variables illustratives ). - Quant au deuxième facteur, il oppose les pays ayant un solde des finances publiques et des recettes significativement élevés et une faible dette brute des APU ( Suède, Finlande, Luxembourg et le Danemark ), aux pays caractérisés par une dette brute importante et un solde des finances publiques et des recettes faibles c est le cas notamment de l Espagne, de l Italie et du Portugal. L origine ( fictive ) des axes représente un pays qui aurait pour caractéristique finances publiques la moyenne des quatre variables actives étudiées. 3 APU - Administrations publiques : Ensemble des unités institutionnelles dont la fonction principale est de produire des services non marchands ou d effectuer des opérations de redistribution du revenu et des richesses nationales. Elles tirent la majeure partie de leurs ressources de contributions obligatoires. Le secteur des administrations publiques comprend les administrations publiques centrales, les administrations publiques locales et les administrations de sécurité sociale. M2 : ECOSMA Analyse des Données

16 2 Analyse Factorielle des Correspondances Le domaine d'application de l'analyse Factorielle des Correspondances 4 (AFC), développée par Benzécri (1969), est différent de celui de l'acp. Alors que cette dernière s'applique aux tableaux de mesures et au traitement de données quantitatives, l'afc est une méthode adaptée à la description d'un tableau de contingence et permet d'étudier les éventuelles relations existant entre les deux variables qualitatives de ce tableau. Le tableau de contingence ou de dépendance est un tableau croisé des effectifs des modalités de deux variables qualitatives ou nominales. La validité de l'afc s'étend à tout tableau de données à condition que les données recensées dans ce tableau soient toutes positives et homogènes. On peut ainsi traiter des tableaux de mesures exprimées dans la même unité, des tableaux d'échanges, tableaux de notes, tableaux de rangs, etc Objectif de la méthode Décrire la dépendance entre deux variables qualitatives ( nominales ). L'observation de deux caractères qualitatifs sur un ensemble d'individus permet de construire un tableau de contingence. Par exemple, pour les créateurs-repreneurs d entreprises, créées ou reprises au cours du premier semestre 1994 ( Source : Insee - Les Créations d entreprises du premier semestre Système productif n mars 96 ), si on veut décrire les éventuels liens entre les secteurs d'activités et les qualifications professionnelles du dernier emploi, le tableau ci-dessous donne la répartition des créateurs-repreneurs d entreprises selon ces deux caractères. Secteur Qualification professionnelle du dernier emploi d activité A.C.C.Entps. Cadre P.Interméd Employé Ouvrier E.S.Qualif Total I.Agro.Alimentaire Industrie Construction Commerce Transport H.C.Restaurants Serv. Entreprises Serv. Ménages Total Tableau de contingence Peut-on donner une réponse graphique à la question : Est-il raisonnable de penser qu'il existe une liaison ( correspondance ) entre les secteurs d'activités des entreprises créées-reprises et la qualification professionnelle du créateur-repreneur? Remarquons tout d'abord qu'un tableau de contingence peut se lire de deux manières différentes : selon ses lignes ou selon ses colonnes. On peut répondre à la question posée en appliquant les principes de l'analyse en Composantes Principales. L'AFC se présente alors comme 2 ACP particulières selon que l'on s'intéresse aux lignes ( secteurs d activités ) ou aux colonnes (qualification professionnelle) du tableau de contingence Première analyse : ACP des profils-lignes ( secteurs d activités ) Si on s'intéresse aux secteurs d activités des entreprises créées-reprises, on construit le tableau des profils-lignes en ramenant le total ligne du tableau de contingence à 1 (100%), on évite ainsi les effets de marges. On détermine ainsi pour chaque secteur d activité la répartition des créateurs-repreneurs selon la qualification professionnelle de leur dernier emploi. Par exemple, c est dans le secteur de la construction que les ouvriers (41.68%) ont créé ou repris le plus d entreprises que tous les autres ou encore ce sont les cadres (9.40%) qui ont créé ou repris le moins d entreprises dans ce secteur (interprétation par rapport au profil moyen : tous secteurs d activités confondus). 4 Factorial Correspondence Analysis (FCA). M2 : ECOSMA Analyse des Données

17 Secteur Qualification professionnelle du dernier emploi Activité A.C.C.Entps. Cadre P.Interméd Employé Ouvrier E.S.Qualif Total I.Agro.Alimentaire Industrie Construction Commerce Transport H.C.Restaurants Serv. Entreprises Serv. Ménages Profil moyen Tableau des profils-lignes (%) Nous allons considérer les lignes de ce tableau comme des individus et les colonnes comme des caractères. On fait ensuite l'acp de ce tableau avec une métrique particulière, (métrique du Khi²) pour calculer les distances entre profils, et des poids proportionnels aux effectifs des lignes. Cela revient en fait à procéder comme pour l'acp normée en remplaçant la matrice des coefficients de corrélation linéaire par une matrice adaptée aux caractères qualitatifs. On obtient ainsi une analyse et des représentations graphiques des secteurs d activités dans des plans factoriels appropriés Deuxième analyse : ACP des profils-colonnes ( qualification professionnelle ) Si on veut s'intéresser aux qualifications professionnelles des créateurs-repreneurs, on construit le tableau des profils-colonnes en ramenant le total colonne du tableau de contingence à 1 (100%). Secteur Qualification professionnelle du dernier emploi profil Activité A.C.C.Entps. Cadre P.Interméd Employé Ouvrier E.S.Qualif moyen I.Agro.Alimentaire Industrie Construction Commerce Transport H.C.Restaurants Serv. Entreprises Serv. Ménages Total Tableau des profils-colonnes (%) On peut ainsi savoir pour chaque catégorie professionnelle comment se répartissent les secteurs d activités des entreprises créées-reprises. Ainsi, on constate que les cadres ont créé ou repris plus d entreprises dans les secteurs des services aux entreprises (37.83%) et de l industrie (8.79%), et moins dans les autres secteurs (interprétation par rapport au profil moyen : toutes qualifications confondues). On procède de la même façon avec le tableau des profils-colonnes en prenant les colonnes pour individus et les lignes pour caractères. On obtient ainsi une analyse et une représentation graphique des qualifications professionnelles. Remarques : 1- La mise en correspondance et le rôle symétrique que fait jouer la métrique du Khi² pour les modalités lignes et colonnes du tableau de contingence, fait que l'acp des profils-lignes est équivalente à l'acp des profils-colonnes : les composantes principales d'une analyse se déduisent de celles de l'autre et les valeurs propres des deux analyses sont identiques. 2- Le nombre d'axes factoriels est toujours inférieur ou égal au min(p-1, q-1) où p et q sont les nombres de modalités des deux caractères qualitatifs. 3- Dans la pratique, on effectue qu'une seule des 2 ACP, les résultats de l'autre analyse se déduisent par des formules de transition. Il est possible de superposer les graphiques (moyennant un changement d'échelle) des 2 ACP pour visualiser, dans les plans factoriels, les liaisons entre les profils-lignes et les profils-colonnes ( représentation simultanée ). 4- Les principes de représentation et les indices de qualité associés dans le cadre de l'analyse en Composantes Principales restent inchangés. M2 : ECOSMA Analyse des Données

18 2.2 Exemple - Résultats Données ( Les créations-reprises d'entreprises ) Enquête réalisée par l'insee auprès de créateurs-repreneurs d'entreprises au cours du premier semestre Nous avons soumis à l'analyse des correspondances le tableau de contingence donnant la qualification professionnelle et le secteur d'activité des créateurs-repreneurs d'entreprises Interprétation de quelques résultats Les résultats et les règles de lecture des représentations graphiques de cette méthode demandent à être interprétés avec prudence. Les deux tableaux de profils permettent de répondre aux questions suivantes : Tableau des profils-lignes : "Quelle est la qualification professionnelle du dernier emploi du créateur ou repreneur de chaque secteur d'activité? Tableau des profils-colonnes : "Quel est le secteur d'activité des entreprises créées ou reprises par chaque qualification professionnelle? La proximité entre deux points "secteur d'activité" signifiera une similitude des profils "qualification professionnelle. Il en est ainsi pour les hôtels-cafés-restaurants et les services aux ménages, par exemple (cf. tableau des profils-lignes). La proximité entre deux points "qualification professionnelle" signifiera une similitude des profils "secteur d'activité". C'est ce que l'on constate pour les professions intermédiaires et les artisans-commerçants-chefs d'entreprise (cf. tableau des profils-colonnes). La proximité entre les hôtels-cafés-restaurants et les services aux ménages s'explique notamment par le fait que dans ces deux secteurs, la proportion d'entreprises créées ou reprises par les employés (13.63%, M2 : ECOSMA Analyse des Données

19 14.38%) est supérieure à la moyenne (9.35%, 11.20%), et une proportion d'entreprises créées ou reprises par les cadres (4.81%, 7.85%) inférieure à la moyenne. Enfin, on notera que les proximités entre profils s'interprètent toujours par référence au profil moyen, et que les proximités les plus aisées à interpréter se situent toujours à la périphérie du graphique. Analyse de la dépendance L Analyse Factorielle des Correspondances (AFC) de la table de contingence conduit à cinq axes factoriels représentant toute l information à résumer c est-à-dire l association symétrique, entre les qualifications professionnelles et les secteurs d activité des créateurs et repreneurs d entreprises, mesurée par le phi-deux de Pearson ( ² = ). Dans le cas de l indépendance des deux variables, hypothèse d indépendance des lignes et des colonnes du tableau de contingence ci-dessous, la mesure de l association serait une réalisation d un khi-deux de Pearson à 35 degrés de liberté ( KHI2 = ), noté ², dont la relation est ² = ² calculé calculé / n, où n = entreprises désigne la taille de l échantillon. L hypothèse d indépendance est évidemment rejetée vu que PROBA ( KHI2 > ) = < 5% (risque d erreur). EDITION DU TABLEAU CROISE TABLEAU 1 EN LIGNE : Secteur d activité POIDS TOTAL : EN COLONNE : Qualification professionnelle du dernier emploi POIDS A.C.C.Entps. Cadre P.Intermédia Employé Ouvrier E.S.Qualific ENSEMBLE % COLONNE % LIGNE I.Agro.Alimentaire Industrie Construction Commerce Transport H.C.Restaurants Serv. Entreprises Serv. Menages ENSEMBLE KHI2 = / 35 DEGRES DE LIBERTE / 0 EFFECTIFS THEORIQUES INFERIEURS A 5 PROBA ( KHI2 > ) = / V.TEST = ANALYSE DES CORRESPONDANCES BINAIRES VALEURS PROPRES APERCU DE LA PRECISION DES CALCULS : TRACE AVANT DIAGONALISATION SOMME DES VALEURS PROPRES HISTOGRAMME DES 5 PREMIERES VALEURS PROPRES NUMERO VALEUR POURCENT. POURCENT. PROPRE CUMULE ******************************************************************************** ***************************** ***** ** * M2 : ECOSMA Analyse des Données

20 COORDONNEES, CONTRIBUTIONS DES FREQUENCES SUR LES AXES 1 A 5 FREQUENCES ACTIVES FREQUENCES COORDONNEES CONTRIBUTIONS COSINUS CARRES IDEN - LIBELLE COURT P.REL DISTO ACCE - A.C.C.ENTREPRISE CADR - CADRES PINT - PROF.INTERMEDIAIRE EMPL - EMPLOYES OUVR - OUVRIERS ESQU - E.SQUALIFICATION COORDONNEES, CONTRIBUTIONS ET COSINUS CARRES DES INDIVIDUS AXES 1 A INDIVIDUS COORDONNEES CONTRIBUTIONS COSINUS CARRES IDENTIFICATEUR P.REL DISTO IAAlimentaire Industrie Construction Commerce Transport HCRestaurants S.Entreprises S.Ménages Créateurs / Repreneurs d entreprises Qualification Activité de l entreprise Représentation de l association Premier plan principal Représentation graphique La dépendance entre le secteur d'activité et la qualification professionnelle du dernier emploi peut être décrite par le premier plan principal qui résume environ 94% de l'information globale. - Le premier axe oppose les secteurs de la construction et de l'industrie agroalimentaire, caractéristiques des ouvriers, au secteur des services aux entreprises représentatif des cadres. - Quant au deuxième axe, il oppose les employés qui ont le plus créé ou repris d'entreprises dans les services aux ménages et les hôtels-cafés-restaurants, aux cadres qui caractérisent les entreprises créées ou reprises dans le secteur des services auprès des entreprises. Enfin, pour éviter des interprétations abusives de proximités graphiques illusoires, comme en Analyse en Composantes Principales, il est recommandé de consulter le tableau des contributions "contributions absolues" et le tableau des cosinus carrés des angles entre les points et avec les axes factoriels "contributions relatives". M2 : ECOSMA Analyse des Données

21 3 Analyse Factorielle des Correspondances Multiples L'analyse de plus de deux variables qualitatives s'effectue à l'aide d'une extension de l'afc que l'on appelle Analyse Factorielle des Correspondances Multiples 5 (AFCM ou ACM). C'est l'une des méthodes les plus utilisées en analyse des données, ses principaux domaines d'applications sont le traitement des questionnaires et l'exploitation des enquêtes par sondages. Du point de vue de l'analyse des données une variable qualitative est une question; ses modalités sont les différentes réponses possibles. Les variables utilisées sont nécessairement qualitatives. Cependant, il est toujours possible de transformer une variable quantitative en une variable qualitative ordinale ( classes d'âges, tranches de salaires, etc. ). Il est possible de positionner des variables continues en élément supplémentaire ( sans transformation au préalable en variable qualitative par découpage en classes ). 3.1 Objectif de la méthode Décrire et étudier les liaisons entre plusieurs variables qualitatives. L'AFCM consiste à effectuer une Analyse Factorielle des Correspondances sur un tableau disjonctif complet ( logique ) ou à un tableau de Burt. Le tableau de Burt est calculé directement à partir du codage condensé ou disjonctif complet. On trouve dans ce tableau tous les tableaux de contingence croisant les variables deux à deux. Sur la diagonale se trouvent les variables croisées avec elles-mêmes, et donc les effectifs correspondant à chaque modalité. Par exemple, dans l'enquête portant sur les créations d'entreprises au cours du premier semestre 1991, on a relevé six variables qualitatives ( questions ) totalisant 29 modalités. ( Source : Insee - Les Créations d entreprises du 1 er semestre Système productif n mars 96 ). Tableau disjonctif complet (logique) : Individu -25 ans ans+ homme femme s.entps s.ména I I I Tableau de Burt : -25 ans ans+ homme femme s.entps s.ména -25ans ans homme femme s.entps s.ména 9131 On peut montrer que les résultats de l'afcm obtenus à partir d'un tableau disjonctif ou d'un tableau de Burt, considéré comme un tableau de données, sont équivalents. Pour des raisons évidentes d'économie de calcul, les logiciels utilisent généralement le tableau de Burt. 5 Multiple «Factorial» Correspondence Analysis (MCA). M2 : ECOSMA Analyse des Données

22 3.2 Exemple - Résultats Données ( Source : Insee - Les Créations d entreprises du premier semestre Système productif n mars 96 ). Enquête réalisée par l'insee auprès de créateurs-repreneurs d'entreprises au cours du premier semestre Nous avons soumis à l'analyse des correspondances multiples six variables qualitatives ( questions ), quatre actives et deux illustratives, totalisant 29 modalités (19 actives et 10 illustratives). Variables actives : Classes d'âge des créateurs-repreneurs ( moins de 25 ans, entre 25 et 39 ans, 40 ans et plus ) Sexe ( homme, femme ) Qualification professionnelle ( artisan/commerçant/chef entreprise, cadre, prof.intermédiaire, employé, ouvrier, étudiant/sans qualification ) Diplôme le plus élevé ( pas diplôme/cep, bepc, cap/bep, bac technique, bac général, bts/dut, deug/équivalent, bac+3 et plus ) Variables illustratives : Situation préalable ( actif, chômeur/non actif ) Secteurs d'activités ( industrie agro-alimentaire, industrie, construction, commerce, transport, hôtel/café/restaurant, services aux entreprises, services aux ménages ) Les variables actives utilisées dans cet exemple représentent la signalétique des créateurs-repreneurs d'entreprises ( classes d'âges, sexe, qualification professionnelle, diplôme le plus élevé ). En général, ces questions décrivent plus ou moins objectivement les créateurs-repreneurs. Les deux autres variables ( situation préalable, secteurs d'activités des entreprises créées ou reprises ), constituant le sujet même de l'enquête, sont représentés en éléments supplémentaires ou illustratifs. M2 : ECOSMA Analyse des Données

23 Remarques : - Il serait maladroit de mélanger, par exemple, des informations de type socio-économique ( âge, sexe, profession, etc. ) et des opinions ou des comportements. Comment interpréterait-on alors la proximité entre deux individus? Si deux individus sont éloignés, est-ce à cause de leurs opinions différentes ou parce qu'ils ont des profils socio-économiques opposés? - On notera que l'analyse exploratoire met en jeu de façon essentielle les dépendances entre les questions actives. Par contre les variables illustratives ( qualitatives ou quantitatives ) sont introduites l'une après l'autre, sans tenir compte de leur éventuelle dépendance Résultats et interprétation ANALYSE DES CORRESPONDANCES BINAIRES VALEURS PROPRES APERCU DE LA PRECISION DES CALCULS : TRACE AVANT DIAGONALISATION SOMME DES VALEURS PROPRES HISTOGRAMME DES 15 PREMIERES VALEURS PROPRES NUMERO VALEUR POURCENT. POURCENT. PROPRE CUMULE ******************************************************************************** ************************************************************************** *************************************************************** *********************************************************** *************************************************** ************************************************* ************************************************ *********************************************** ********************************************** ********************************************* **************************************** ***************************** *********************** ***************** *********** Compte tenu de la nature particulière du tableau disjonctif qui conduit à un nuage très éparpillé, les pourcentages d'information apportés par chaque axe sont en général très faibles ce qui surprend le néophyte. Il n'y a là rien d'inquiétant mais cela rend un peu plus délicat le choix du nombre pertinent d'axes factoriels à retenir. Les règles de lecture sont semblables à celles de l'afc. Seuls les calculs de contributions cumulées pour les modalités de chaque question active ont été ajoutés. D après les résultats graphiques et numériques précédents, on interprétera l analyse des deux premiers facteurs en s aidant des tableaux des contributions et des cosinus carrés. Le premier plan factoriel résume environ 27% de la dépendance entre les caractères signalétiques des créateurs-repreneurs, elle peut être interprétée de la façon suivante : - Le premier axe caractérise surtout la qualification professionnelle du dernier emploi des créateursrepreneurs ainsi que leurs diplômes, il oppose les jeunes ouvriers et employés d'un niveau CAP/BEP, aux cadres artisans-commerçants et chefs d'entreprise plus âgés et plus diplômés (DEUG et BAC+3). - Le deuxième axe caractérise davantage la qualification professionnelle du dernier emploi ainsi que le sexe des créateurs-repreneurs. Il oppose les femmes étudiantes ou sans qualification d'un niveau BAC général aux ouvriers diplômés d'un CAP/BEP. Le deuxième graphique montre la projection des modalités de réponses des deux caractères illustratifs sur le premier plan principal de l analyse de la signalétique des créateurs-repreneurs d'entreprises. Pour l interprétation des modalités de ces caractères, on s aidera du tableau des valeurs-test. Ainsi, - Le premier axe oppose donc les jeunes ouvriers et employés d'un niveau CAP/BEP qui étaient inactifs ou chômeurs et qui ont créé ou repris des entreprises dans les secteurs de l'industrie agroalimentaire, des transports et des hôtels-cafés-restaurants, aux cadres artisans-commerçants et chefs d'entreprise plus âgés et plus diplômés (DEUG, BAC+3) qui étaient actifs et qui ont créé ou repris dans le secteur des services aux entreprises. - Le deuxième axe oppose les femmes étudiantes ou sans qualification d'un niveau BAC général, qui ont créé ou repris des entreprises de services aux ménages, aux ouvriers diplômés d'un CAP/BEP, qui ont créé ou repris des entreprises dans les secteurs de la construction et de l'industrie. M2 : ECOSMA Analyse des Données

24 4 Analyse Factorielle Discriminante L'Analyse Factorielle Discriminante 6 (AFD) et les techniques associées ont pris une grande importance ces dernières années. Appliquées essentiellement dans le domaine médical pour l aide au diagnostic, elles sont maintenant utilisées dans des domaines très variés : en économie, en reconnaissance des formes, dans les banques et les assurances avec les techniques de scoring, dans le domaine biomédical, du management pour décider de l'avenir d'une entreprise en fonction de ses diverses mesures comptables, de la vente pour sélectionner les clients potentiels les plus intéressants, etc. L objectif de l analyse discriminante dite «décisionnelle» est de définir une règle permettant de classer un individu dans un groupe particulier, parmi les groupes possibles. Cette affectation à un groupe donné se fait sur la base des caractéristiques (variables) observées sur cet individu. Elle permet aussi de mettre en évidence les liaisons existant entre un caractère qualitatif à expliquer (à discriminer) et un ensemble de caractères explicatifs quantitatifs (discriminants). En analyse discriminante, on distingue a priori deux ou plusieurs groupes d individus sur lesquels on mesure un ensemble de caractères communs. L analyse va alors chercher à mettre en évidence ce qui différencie ces groupes. 4.1 Objectif de la méthode En réalité, le but précis de l analyse discriminante dépend du contexte. Dans la plupart des cas, l aspect diagnostic est essentiel. On vise avant tout une bonne prédiction des groupes a priori. La bonne affectation, dans le futur, d individus de provenance inconnue est le but principal. Elle se différencie des méthodes de classification 7, dans la mesure où les classes (groupes) sont définies au départ de l analyse. On distingue donc deux objectifs pour l'analyse discriminante : - Objectif descriptif : rechercher quels sont les caractères qui permettent de séparer le mieux possible les classes (groupes) d'individus et donner des représentations graphiques qui rendent compte au mieux de cette séparation. - Objectif décisionnel : Un nouvel individu (anonyme) se présente, pour lequel on ne connaît que les valeurs des caractères descriptifs discriminants, il s'agit alors de décider dans quelle classe il faut l'affecter. L'analyse discriminante tente alors de résoudre le problème de l'affectation à une classe d'un individu caractérisé par de nombreux caractères explicatifs. Les fonctions linéaires discriminantes seront les combinaisons linéaires de ces caractères, dont les valeurs séparent au mieux des classes connues a priori. Par exemple, certains résultats réalisés sur un ensemble d'entreprises caractérisé par une série de mesures comptables (C.A., différents ratios, frais de publicité, etc.) et dont on connaît leur situation actuelle (bonne, stable, critique), on se propose de "prédire" (ou de décider) l'avenir d'une nouvelle entreprise connaissant ses résultats sur le même ensemble de mesures comptables. A partir de ces informations, l'analyse discriminante va prévoir la situation la plus probable de cette nouvelle entreprise. Exemple : Caractéristiques de 200 entreprises. Le caractère qualitatif à discriminer "Situation de l'entreprise" comprend ici trois modalités (bonne, stable, critique) et les caractères explicatifs quantitatifs sont les mesures comptables : Chiffre d affaires annuel (M.F.), nombre de Salariés, nombre de points de Vente,..., frais de Publicité (M.F.). Caractères explicatifs Caractère à expliquer Mesures comptables Situation de l entreprise Ets C.A. S V P Bonne Stable Critique Classe E E E Tableau des données Le tableau ci-dessous contient les valeurs moyennes des mesures comptables des 200 entreprises sur chacune des trois situations. 6 Factorial Discriminant Analysis (FDA, descriptive discriminant analysis, canonical variate analysis). 7 Cluster analysis, classification. M2 : ECOSMA Analyse des Données

25 Mesures comptables Classes C.A. S V P Effectif Poids Bonne Stable Critique Tableau des centres des classes Ainsi, d'un point de vue de la discrimination, l'analyse factorielle discriminante, en décrivant l'échantillon d'apprentissage composé de 200 entreprises, permet de répondre aux questions préalables suivantes : - Est-il possible de réaliser la discrimination à partir des caractères descriptifs (mesures comptables) choisis? - Comment se comportent les caractères descriptifs vis-à-vis des trois classes à discriminer? - Quelles sont les caractères ou les groupes de caractères les plus discriminants? Peut-on donner une réponse graphique à la question : Dans quelle mesure la situation d'une entreprise dépend-t-elle des mesures comptables? 0n peut répondre à la question posée en appliquant les principes de l'analyse en Composantes Principales au tableau des centres des classes. l'afd se présente alors comme une ACP particulière. 4.2 Analyse en Composantes Principales des centres des classes : On considère alors les centres des classes comme des individus et les colonnes comme des variables. On fait ensuite l'acp de ce tableau avec une métrique particulière, (distance de Mahalanobis) pour calculer les proximités entre les centres des classes, et des poids proportionnels aux effectifs des classes. On obtient ainsi, une analyse et des représentations graphiques sur des plans factoriels appropriés qui permettent de séparer au mieux les centres des classes. Les résultats d'une AFD peuvent alors se visualiser sur les plans factoriels appelés plans discriminants et se formuler par des critères d'inertie : - maximiser l'inertie interclasses : séparer au mieux les centres des classes afin d'exalter les différences entre classes. - minimiser l'inertie intra-classes : les individus appartenant à une même classe soient le plus concentrés possible autour du centre de la classe afin que l'étendue dans les classes soit bien délimitée. Les principes de représentation et les indices de qualité sont les mêmes que ceux de l'analyse en Composantes Principales. Remarques : - Cas de deux classes, on retrouve les résultats de l'analyse discriminante linéaire classique rencontrée fréquemment lors des applications. C'est aussi un cas particulier de la régression multiple, où la variable à expliquer ne prend que deux valeurs (modalités), chacune d'elles caractérisant une classe. - Quand le nombre de variables descriptives est très élevé relativement à la taille de l'échantillon, il est souvent indispensable de passer par une phase de sélection des "meilleurs" caractères discriminants afin d'obtenir une discrimination satisfaisante. Certains logiciels d'analyse de données proposent des méthodes hiérarchiques de sélection des caractères, basées sur des critères de mesure du "pouvoir" discriminant de ces caractères. Ce sont des techniques de discrimination pas à pas analogues à la régression stepwise où on introduit au fur et à mesure les caractères explicatifs dans une formule de discrimination. - L'Analyse Factorielle Discriminante sur un ensemble de variables qualitatives explicatives (discriminantes) et une AFD sur les composantes principales (quantitatives) de l'afcm des variables explicatives. M2 : ECOSMA Analyse des Données

26 4.3.1 Discrimination en 2 classes - Exemple - Données ( Le marché belge des petites voitures ) On s'intéresse ici à un échantillon de voitures de moins de 3,80 mètres. On dispose du prix en milliers de francs belges, de la consommation urbaine, de la cylindrée, de la vitesse maximum, du volume maximum du coffre, du rapport poids/puissance et de la longueur de 27 voitures. L'objectif est de mettre en évidence les caractéristiques qui différencient ces voitures concurrentes. On désire déterminer dans quelle mesure la marque du constructeur est liée aux caractéristiques mesurées par les six caractères quantitatifs ( prix en milliers de francs belges, consommation urbaine, cylindrée, vitesse maximum, volume maximum du coffre et le rapport poids/puissance ). Le caractère qualitatif à discriminer, marque du constructeur ( Française, Etrangère ), prend ici deux modalités. Disposant des caractéristiques de trois nouvelles petites voitures, anonymes quant à leur marque, on se propose de visualiser ces voitures dans les plans discriminants de l'analyse et ainsi tenter de prévoir la marque de leur constructeur. Ces trois voitures seront considérées dans l'analyse comme individus supplémentaires. ADL : Marché des petites voitures en Belgique Caractères discriminants Caractère à discriminer (caractéristiques) (Marque constructeur) actives : 6 Modalités : 2 Prix France Consommation Etranger Cylindrée Vitesse Volume P/P : poids-puissance Voitures actives : 27 Voitures illustratives : 3 Clio Citroën AX Rover AFD : Marché des petites voitures en Belgique SELECTION DES INDIVIDUS ET DES VARIABLES UTILES VARIABLES NOMINALES ACTIVES 1 VARIABLES 2 MODALITES ASSOCIEES Marque du constructeur ( 2 MODALITES ) VARIABLES CONTINUES ACTIVES 6 VARIABLES Prix ( CONTINUE ) 2. Consommation urbaine ( CONTINUE ) 3. Cylindrée ( CONTINUE ) 4. Vitesse ( CONTINUE ) 5. Volume maximum du coffre ( CONTINUE ) 6. Rapport poids/puissance ( CONTINUE ) 7. Longueur ( CONTINUE ) INDIVIDUS NOMBRE POIDS POIDS DES INDIVIDUS: Poids des individus, uniforme egal a 1. RETENUS... NITOT = 30 PITOT = SELECTION APRES FILTRAGE ACTIFS... NIACT = 27 PIACT = SUPPLEMENTAIRES... NISUP = 3 PISUP = UNIF STATISTIQUES USUELLES DES VARIABLES TRIS A PLAT DES VARIABLES NOMINALES EFFECTIFS ABSOLU %/TOTAL %/EXPR. HISTOGRAMME DES POIDS 9. Marque du constructeur MFRA - Française ****************** METR - Etrangère ***************************** ENSEMBLE M2 : ECOSMA Analyse des Données

27 Exemple ADL : Marché des petites voitures en Belgique Dans le cas de deux groupes, l analyse discriminante classique est formellement équivalente à une régression. Appliquée sur les coordonnées factorielles de l analyse en composantes principales des caractéristiques des voitures, l analyse discriminante de Fisher fournit le modèle de discrimination c est-à-dire la combinaison linéaire des variables qui séparent au mieux les deux groupes de voitures. SELECTION DES INDIVIDUS ET DES VARIABLES UTILES VARIABLES NOMINALES ACTIVES 1 VARIABLES 2 MODALITES ASSOCIEES Marque du constructeur ( 2 MODALITES ) VARIABLES CONTINUES ACTIVES 7 VARIABLES Prix ( CONTINUE ) 2. Consommation urbaine ( CONTINUE ) 3. Cylindrée ( CONTINUE ) 4. Vitesse ( CONTINUE ) 5. Volume maximum du coffre ( CONTINUE ) 6. Rapport poids/puissance ( CONTINUE ) 7. Longueur ( CONTINUE ) INDIVIDUS NOMBRE POIDS POIDS DES INDIVIDUS: Poids des individus, uniforme egal a 1. RETENUS... NITOT = 30 PITOT = SELECTION APRES FILTRAGE ACTIFS... NIACT = 27 PIACT = SUPPLEMENTAIRES... NISUP = 3 PISUP = ANALYSE DISCRIMINANTE A 2 GROUPES MODELE 1 DEFINITION :----- MODELE : V9 =V1--V7 GESTION DES DONNEES MANQUANTES AUCUNE VALEUR MANQUANTE DETECTEE ANALYSE DISCRIMINANTE LINEAIRE SUR L'ECHANTILLON : DE BASE ENTRE LES 2 GROUPES : Française ET Etrangère VARIABLE DE GROUPE NUMERO 9 : Marque du constructeur UNIF M2 : ECOSMA Analyse des Données

L ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ

L ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ L ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ INTRODUCTION Données : n individus observés sur p variables quantitatives. L A.C.P. permet d eplorer les liaisons entre variables et

Plus en détail

Déroulement d un projet en DATA MINING, préparation et analyse des données. Walid AYADI

Déroulement d un projet en DATA MINING, préparation et analyse des données. Walid AYADI 1 Déroulement d un projet en DATA MINING, préparation et analyse des données Walid AYADI 2 Les étapes d un projet Choix du sujet - Définition des objectifs Inventaire des données existantes Collecte, nettoyage

Plus en détail

Structure du cours : Il existe de nombreuses méthodes intéressantes qui couvrent l Analyse des Données

Structure du cours : Il existe de nombreuses méthodes intéressantes qui couvrent l Analyse des Données Structure du cours : Il existe de nombreuses méthodes intéressantes qui couvrent l Analyse des Données et le Data Mining Nous suivons le plan suivant : Fonctionnement de Spad Catalogue des méthodes (statistiques

Plus en détail

Introduction. Préambule. Le contexte

Introduction. Préambule. Le contexte Préambule... INTRODUCTION... BREF HISTORIQUE DE L ACP... 4 DOMAINE D'APPLICATION... 5 INTERPRETATIONS GEOMETRIQUES... 6 a - Pour les n individus... 6 b - Pour les p variables... 7 c - Notion d éléments

Plus en détail

La classification automatique de données quantitatives

La classification automatique de données quantitatives La classification automatique de données quantitatives 1 Introduction Parmi les méthodes de statistique exploratoire multidimensionnelle, dont l objectif est d extraire d une masse de données des informations

Plus en détail

L'analyse des données à l usage des non mathématiciens

L'analyse des données à l usage des non mathématiciens Montpellier L'analyse des données à l usage des non mathématiciens 2 ème Partie: L'analyse en composantes principales AGRO.M - INRA - Formation Permanente Janvier 2006 André Bouchier Analyses multivariés.

Plus en détail

Extraction d informations stratégiques par Analyse en Composantes Principales

Extraction d informations stratégiques par Analyse en Composantes Principales Extraction d informations stratégiques par Analyse en Composantes Principales Bernard DOUSSET IRIT/ SIG, Université Paul Sabatier, 118 route de Narbonne, 31062 Toulouse cedex 04 dousset@irit.fr 1 Introduction

Plus en détail

INTRODUCTION À L ANALYSE FACTORIELLE DES CORRESPONDANCES

INTRODUCTION À L ANALYSE FACTORIELLE DES CORRESPONDANCES INTRODUCTION À L ANALYSE FACTORIELLE DES CORRESPONDANCES Dominique LAFFLY Maître de Conférences, Université de Pau Laboratoire Société Environnement Territoire UMR 5603 du CNRS et Université de Pau Domaine

Plus en détail

Logiciel XLSTAT version 7.0. 40 rue Damrémont 75018 PARIS

Logiciel XLSTAT version 7.0. 40 rue Damrémont 75018 PARIS Logiciel XLSTAT version 7.0 Contact : Addinsoft 40 rue Damrémont 75018 PARIS 2005-2006 Plan Présentation générale du logiciel Statistiques descriptives Histogramme Discrétisation Tableau de contingence

Plus en détail

Projet SINF2275 «Data mining and decision making» Projet classification et credit scoring

Projet SINF2275 «Data mining and decision making» Projet classification et credit scoring Projet SINF2275 «Data mining and decision making» Projet classification et credit scoring Année académique 2006-2007 Professeurs : Marco Saerens Adresse : Université catholique de Louvain Information Systems

Plus en détail

Statistique Descriptive Multidimensionnelle. (pour les nuls)

Statistique Descriptive Multidimensionnelle. (pour les nuls) Publications de l Institut de Mathématiques de Toulouse Statistique Descriptive Multidimensionnelle (pour les nuls) (version de mai 2010) Alain Baccini Institut de Mathématiques de Toulouse UMR CNRS 5219

Plus en détail

ESIEA PARIS 2011-2012

ESIEA PARIS 2011-2012 ESIEA PARIS 2011-2012 Examen MAT 5201 DATA MINING Mardi 08 Novembre 2011 Première Partie : 15 minutes (7 points) Enseignant responsable : Frédéric Bertrand Remarque importante : les questions de ce questionnaire

Plus en détail

LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING»

LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING» LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING» Gilbert Saporta Professeur de Statistique Appliquée Conservatoire National des Arts et Métiers Dans leur quasi totalité, les banques et organismes financiers

Plus en détail

QUELLE DOIT ÊTRE L AMPLEUR DE LA CONSOLIDATION BUDGÉTAIRE POUR RAMENER LA DETTE À UN NIVEAU PRUDENT?

QUELLE DOIT ÊTRE L AMPLEUR DE LA CONSOLIDATION BUDGÉTAIRE POUR RAMENER LA DETTE À UN NIVEAU PRUDENT? Pour citer ce document, merci d utiliser la référence suivante : OCDE (2012), «Quelle doit être l ampleur de la consolidation budgétaire pour ramener la dette à un niveau prudent?», Note de politique économique

Plus en détail

SIG ET ANALYSE EXPLORATOIRE

SIG ET ANALYSE EXPLORATOIRE SIG ET ANALYSE EXPLORATOIRE VERS DE NOUVELLES PRATIQUES EN GÉOGRAPHIE Jean-Marc ORHAN Equipe P.A.R.I.S., URA 1243 du CNRS Paris Résumé L'offre actuelle dans le domaine des logiciels de type Système d'information

Plus en détail

1. Vocabulaire : Introduction au tableau élémentaire

1. Vocabulaire : Introduction au tableau élémentaire L1-S1 Lire et caractériser l'information géographique - Le traitement statistique univarié Statistique : le terme statistique désigne à la fois : 1) l'ensemble des données numériques concernant une catégorie

Plus en détail

La révision des indices du cours du franc suisse, nominaux et réels, pondérés par les exportations

La révision des indices du cours du franc suisse, nominaux et réels, pondérés par les exportations La révision des indices du cours du franc suisse, nominaux et réels, pondérés par les exportations par Robert Fluri et Robert Müller, Direction de la statistique, Banque nationale suisse, Zurich BNS 42

Plus en détail

ASSURANCE-LITIGE EN MATIÈRE DE BREVETS

ASSURANCE-LITIGE EN MATIÈRE DE BREVETS Étude concernant l assurance-litige en matière de brevets, par CJA Consultants Ltd Janvier 2003 V4a.fin ASSURANCE-LITIGE EN MATIÈRE DE BREVETS Étude réalisée pour la Commission européenne concernant la

Plus en détail

Quelle part de leur richesse nationale les pays consacrent-ils à l éducation?

Quelle part de leur richesse nationale les pays consacrent-ils à l éducation? Indicateur Quelle part de leur richesse nationale les pays consacrent-ils à l éducation? En 2008, les pays de l OCDE ont consacré 6.1 % de leur PIB cumulé au financement de leurs établissements d enseignement.

Plus en détail

Chapitre 3. Les distributions à deux variables

Chapitre 3. Les distributions à deux variables Chapitre 3. Les distributions à deux variables Jean-François Coeurjolly http://www-ljk.imag.fr/membres/jean-francois.coeurjolly/ Laboratoire Jean Kuntzmann (LJK), Grenoble University 1 Distributions conditionnelles

Plus en détail

Analyse en Composantes Principales

Analyse en Composantes Principales Analyse en Composantes Principales Anne B Dufour Octobre 2013 Anne B Dufour () Analyse en Composantes Principales Octobre 2013 1 / 36 Introduction Introduction Soit X un tableau contenant p variables mesurées

Plus en détail

1 Complément sur la projection du nuage des individus

1 Complément sur la projection du nuage des individus TP 0 : Analyse en composantes principales (II) Le but de ce TP est d approfondir nos connaissances concernant l analyse en composantes principales (ACP). Pour cela, on reprend les notations du précédent

Plus en détail

OBSERVATOIRE DE L EPARGNE EUROPEENNE

OBSERVATOIRE DE L EPARGNE EUROPEENNE Conférence de presse du 22 juin 2001 Fiscalité des produits d épargne: une comparaison internationale Il n existe pas de véritable point de vue européen en matière de fiscalité des produits d épargne.

Plus en détail

Les comptes nationaux et le SEC 2010

Les comptes nationaux et le SEC 2010 Les comptes nationaux et le SEC 2010 7 ème séminaire de la Banque nationale de Belgique pour enseignants en économie du secondaire Bruxelles, le 22 octobre 2014 Catherine RIGO Plan de l exposé Introduction

Plus en détail

MASTER 2 SCIENCES HUMAINES ET SOCIALES Mention Psychologie. Spécialité : Recherches en psychologie

MASTER 2 SCIENCES HUMAINES ET SOCIALES Mention Psychologie. Spécialité : Recherches en psychologie S3 Spécialité : Recherches en psychologie UE OBLIGATOIRES UE 1 : Epistémologie et méthodes de recherche en psychologie Ce séminaire aborde plusieurs aspects de la recherche en psychologie. Il présente

Plus en détail

Le Data Mining au service du Scoring ou notation statistique des emprunteurs!

Le Data Mining au service du Scoring ou notation statistique des emprunteurs! France Le Data Mining au service du Scoring ou notation statistique des emprunteurs! Comme le rappelle la CNIL dans sa délibération n 88-083 du 5 Juillet 1988 portant adoption d une recommandation relative

Plus en détail

Qu est-ce que la croissance économique? Quels sont ses moteurs?

Qu est-ce que la croissance économique? Quels sont ses moteurs? Qu est-ce que la croissance économique? Quels sont ses moteurs? En ces temps de crise économique et de crise des dettes souveraines (ou publiques), tous les hommes politiques de gauche comme de droite

Plus en détail

PREPROCESSING PAR LISSAGE LOESS POUR ACP LISSEE

PREPROCESSING PAR LISSAGE LOESS POUR ACP LISSEE PREPROCESSING PAR LISSAGE LOESS POUR ACP LISSEE Jean-Paul Valois, Claude Mouret & Nicolas Pariset Total, 64018 Pau Cédex MOTS CLEFS : Analyse spatiale, ACP, Lissage, Loess PROBLEMATIQUE En analyse multivariée,

Plus en détail

a) La technique de l analyse discriminante linéaire : une brève présentation. 3 étapes de la méthode doivent être distinguées :

a) La technique de l analyse discriminante linéaire : une brève présentation. 3 étapes de la méthode doivent être distinguées : a) La technique de l analyse discriminante linéaire : une brève présentation. Nous nous limiterons ici à l'analyse discriminante linéaire et à deux groupes : - linéaire, la variante utilisée par ALTMAN

Plus en détail

Les conducteurs automobiles évaluent-ils correctement leur risque de commettre un accident?

Les conducteurs automobiles évaluent-ils correctement leur risque de commettre un accident? Les conducteurs automobiles évaluent-ils correctement leur risque de commettre un accident? Nathalie LEPINE GREMAQ, Université de Toulouse1, 31042 Toulouse, France GRAPE, Université Montesquieu-Bordeaux

Plus en détail

12. Le système monétaire

12. Le système monétaire 12. Le système monétaire Le rôle de la monnaie est fondamental. Imaginez une situation où aucun moyen de paiement ne ferait l unanimité : - Economie de «troc». - On échange des biens et services contre

Plus en détail

L indice de SEN, outil de mesure de l équité des systèmes éducatifs. Une comparaison à l échelle européenne

L indice de SEN, outil de mesure de l équité des systèmes éducatifs. Une comparaison à l échelle européenne L indice de SEN, outil de mesure de l équité des systèmes éducatifs. Une comparaison à l échelle européenne Sophie Morlaix To cite this version: Sophie Morlaix. L indice de SEN, outil de mesure de l équité

Plus en détail

Solutions Décisionnelles SPAD. La maîtrise des données, l'art de la décision

Solutions Décisionnelles SPAD. La maîtrise des données, l'art de la décision Solutions Décisionnelles SPAD La maîtrise des données, l'art de la décision SPAD, la référence en Analyse de Données et Data Mining La solution logicielle SPAD permet de tirer le meilleur parti de tous

Plus en détail

Aide-mémoire de statistique appliquée à la biologie

Aide-mémoire de statistique appliquée à la biologie Maxime HERVÉ Aide-mémoire de statistique appliquée à la biologie Construire son étude et analyser les résultats à l aide du logiciel R Version 5(2) (2014) AVANT-PROPOS Les phénomènes biologiques ont cela

Plus en détail

Principe d un test statistique

Principe d un test statistique Biostatistiques Principe d un test statistique Professeur Jean-Luc BOSSON PCEM2 - Année universitaire 2012/2013 Faculté de Médecine de Grenoble (UJF) - Tous droits réservés. Objectifs pédagogiques Comprendre

Plus en détail

Quelques éléments de statistique multidimensionnelle

Quelques éléments de statistique multidimensionnelle ANNEXE 1 Quelques éléments de statistique multidimensionnelle Les méthodes d analyse statistique exploratoire utilisées au cours des chapitres précédents visent à mettre en forme de vastes ensembles de

Plus en détail

Qui sont les enseignants?

Qui sont les enseignants? Extrait de : Regards sur l'éducation 2008 : Panorama Accéder à cette publication : http://dx.doi.org/10.1787/9789264040649-fr Qui sont les enseignants? Merci de citer ce chapitre comme suit : OCDE (2009),

Plus en détail

IBM SPSS Direct Marketing

IBM SPSS Direct Marketing IBM SPSS Statistics 19 IBM SPSS Direct Marketing Comprenez vos clients et renforcez vos campagnes marketing Points clés Avec IBM SPSS Direct Marketing, vous pouvez : Comprendre vos clients de manière plus

Plus en détail

Les perspectives économiques

Les perspectives économiques Les perspectives économiques Les petits-déjeuners du maire Chambre de commerce d Ottawa / Ottawa Business Journal Ottawa (Ontario) Le 27 avril 2012 Mark Carney Mark Carney Gouverneur Ordre du jour Trois

Plus en détail

L'analyse de données. Polycopié de cours ENSIETA - Réf. : 1463. Arnaud MARTIN

L'analyse de données. Polycopié de cours ENSIETA - Réf. : 1463. Arnaud MARTIN L'analyse de données Polycopié de cours ENSIETA - Réf : 1463 Arnaud MARTIN Septembre 2004 Table des matières 1 Introduction 1 11 Domaines d'application 2 12 Les données 2 13 Les objectifs 3 14 Les méthodes

Plus en détail

Christophe CANDILLIER Cours de DataMining mars 2004 Page 1

Christophe CANDILLIER Cours de DataMining mars 2004 Page 1 Christophe CANDILLIER Cours de DataMining mars 2004 age 1 1. Introduction 2. rocessus du DataMining 3. Analyse des données en DataMining 4. Analyse en Ligne OLA 5. Logiciels 6. Bibliographie Christophe

Plus en détail

RAPPORT TECHNIQUE CCE 2014-2415

RAPPORT TECHNIQUE CCE 2014-2415 RAPPORT TECHNIQUE CCE 2014-2415 CCE 2014-2415 Rapport technique 2014 22 décembre 2014 2 CCE 2014-2415 3 CCE 2014-2415 Le tableau 1 présente les principaux indicateurs du contexte macro-économique belge

Plus en détail

APPLICATION DU SCN A L'EVALUATION DES REVENUS NON DECLARES DES MENAGES

APPLICATION DU SCN A L'EVALUATION DES REVENUS NON DECLARES DES MENAGES 4 mars 1996 FRANCAIS Original : RUSSE COMMISSION DE STATISTIQUE et COMMISSION ECONOMIQUE POUR L'EUROPE CONFERENCE DES STATISTICIENS EUROPEENS OFFICE STATISTIQUE DES COMMUNAUTES EUROPEENNES (EUROSTAT) ORGANISATION

Plus en détail

LES RETRAITES. Dossier d information. Avril 2010

LES RETRAITES. Dossier d information. Avril 2010 LES RETRAITES en france Dossier d information Avril 2010 LES RETRAITES en france Dossier d information Avril 2010 Contact presse Éva Quickert-Menzel 01 44 38 22 03 Sommaire Chiffres-clés des retraites...

Plus en détail

OBJET : Utilisation des données contenues dans les annuaires téléphoniques.

OBJET : Utilisation des données contenues dans les annuaires téléphoniques. RECOMMANDATION N 01 / 1999 du 23 juin 1999 N. Réf. : 10 / IP / 1998 / 389 / 27 / ACL OBJET : Utilisation des données contenues dans les annuaires téléphoniques. La Commission de la protection de la vie

Plus en détail

3 Les premiers résultats des plans d'actions

3 Les premiers résultats des plans d'actions 3 Les premiers résultats des plans d'actions Les résultats que nous avons obtenus en ce qui concerne les plans d'action, résultent de l'analyse de 48 entreprises seulement. Revenons sur notre échantillon.

Plus en détail

INTRODUCTION A LA MACROECONOMIE Séance de travaux dirigés n 4 Construction des comptes de secteur

INTRODUCTION A LA MACROECONOMIE Séance de travaux dirigés n 4 Construction des comptes de secteur Université Montesquieu Bordeaux IV 1 ère année Licence AES Année universitaire 2012-2013 INTRODUCTION A LA MACROECONOMIE Séance de travaux dirigés n 4 Construction des comptes de secteur Questions préliminaires

Plus en détail

INTRODUCTION AU DATA MINING

INTRODUCTION AU DATA MINING INTRODUCTION AU DATA MINING 6 séances de 3 heures mai-juin 2006 EPF - 4 ème année - Option Ingénierie d Affaires et de Projets Bertrand LIAUDET TP DE DATA MINING Le TP et le projet consisteront à mettre

Plus en détail

L Europe des consommateurs : Contexte international Rapport Eurobaromètre 47.0

L Europe des consommateurs : Contexte international Rapport Eurobaromètre 47.0 L Europe des consommateurs : Contexte international Rapport Eurobaromètre 47. Résumé La question de la position des consommateurs vis-à-vis du commerce international a été abordée en particulier par deux

Plus en détail

Statistique Descriptive Élémentaire

Statistique Descriptive Élémentaire Publications de l Institut de Mathématiques de Toulouse Statistique Descriptive Élémentaire (version de mai 2010) Alain Baccini Institut de Mathématiques de Toulouse UMR CNRS 5219 Université Paul Sabatier

Plus en détail

Analyse des correspondances avec colonne de référence

Analyse des correspondances avec colonne de référence ADE-4 Analyse des correspondances avec colonne de référence Résumé Quand une table de contingence contient une colonne de poids très élevé, cette colonne peut servir de point de référence. La distribution

Plus en détail

Étude de cas Assurance (d après une étude de Philippe Périé, CISIA)

Étude de cas Assurance (d après une étude de Philippe Périé, CISIA) Étude de cas Assurance (d après une étude de Philippe Périé, CISIA) I.1.Les données L échantillon est constitué de 1106 assurés Belges observés en 1992 et répartis en 2 groupes. - les assurés qui n ont

Plus en détail

Relation entre deux variables : estimation de la corrélation linéaire

Relation entre deux variables : estimation de la corrélation linéaire CHAPITRE 3 Relation entre deux variables : estimation de la corrélation linéaire Parmi les analyses statistiques descriptives, l une d entre elles est particulièrement utilisée pour mettre en évidence

Plus en détail

Le travail est-il le meilleur antidote contre la pauvreté?

Le travail est-il le meilleur antidote contre la pauvreté? ISBN 978-92-64-6795- Perspectives de l emploi de l 29 Faire face à la crise de l emploi 29 Chapitre 3 Le travail est-il le meilleur antidote contre la pauvreté? L emploi réduit considérablement le risque

Plus en détail

TABLE DES MATIÈRES. Bruxelles, De Boeck, 2011, 736 p.

TABLE DES MATIÈRES. Bruxelles, De Boeck, 2011, 736 p. STATISTIQUE THÉORIQUE ET APPLIQUÉE Tome 2 Inférence statistique à une et à deux dimensions Pierre Dagnelie TABLE DES MATIÈRES Bruxelles, De Boeck, 2011, 736 p. ISBN 978-2-8041-6336-5 De Boeck Services,

Plus en détail

Compétitivité française : Quelques constats

Compétitivité française : Quelques constats Compétitivité française : Quelques constats Gilbert Cette Banque de France et Université d Aix-Marseille Gilbert Cette 1 Sommaire 1.1 Dégradation alarmante 1.2 Dégradation stoppée 1.3 En particulier vis-à-vis

Plus en détail

COMMUNICATEUR BLISS COMMANDE PAR UN SENSEUR DE POSITION DE L'OEIL

COMMUNICATEUR BLISS COMMANDE PAR UN SENSEUR DE POSITION DE L'OEIL COMMUNICATEUR BLISS COMMANDE PAR UN SENSEUR DE POSITION DE L'OEIL J. TICHON(1) (2), J.-M. TOULOTTE(1), G. TREHOU (1), H. DE ROP (2) 1. INTRODUCTION Notre objectif est de réaliser des systèmes de communication

Plus en détail

La situation financière des SNF françaises Quelques éléments de diagnostic élaborés à partir des comptes nationaux

La situation financière des SNF françaises Quelques éléments de diagnostic élaborés à partir des comptes nationaux La situation financière des SNF françaises Quelques éléments de diagnostic élaborés à partir des comptes nationaux 21 novembre 2014 Gilbert Cette 1. Définitions et sources Valeur ajoutée aux coûts des

Plus en détail

données en connaissance et en actions?

données en connaissance et en actions? 1 Partie 2 : Présentation de la plateforme SPSS Modeler : Comment transformer vos données en connaissance et en actions? SPSS Modeler : l atelier de data mining Large gamme de techniques d analyse (algorithmes)

Plus en détail

Actifs des fonds de pension et des fonds de réserve publics

Actifs des fonds de pension et des fonds de réserve publics Extrait de : Panorama des pensions 2013 Les indicateurs de l'ocde et du G20 Accéder à cette publication : http://dx.doi.org/10.1787/pension_glance-2013-fr Actifs des fonds de pension et des fonds de réserve

Plus en détail

Filière «Économie et Entreprise» 2015/2016

Filière «Économie et Entreprise» 2015/2016 Filière «Économie et Entreprise» 2015/2016 1. Présentation de la filière Économie et Entreprise La filière «Economie et entreprises» de quatrième année de SciencesPo Strasbourg donne aux étudiants, dans

Plus en détail

Le taux d'actualisation en assurance

Le taux d'actualisation en assurance The Geneva Papers on Risk and Insurance, 13 (No 48, July 88), 265-272 Le taux d'actualisation en assurance par Pierre Devolder* Introduction Le taux d'actualisation joue un role determinant dans Ia vie

Plus en détail

Analyse discriminante et régression logistique: application au cas de l innovation pour les entreprises du Canton du Tessin

Analyse discriminante et régression logistique: application au cas de l innovation pour les entreprises du Canton du Tessin Analyse discriminante et régression logistique: application au cas de l innovation pour les entreprises du Canton du Tessin Sandro Petrillo Université de Neuchâtel - Diplôme Postgrade en Statistique Projet

Plus en détail

LES DÉTERMINANTS DE MATRICES

LES DÉTERMINANTS DE MATRICES LES DÉTERMINANTS DE MATRICES Sommaire Utilité... 1 1 Rappel Définition et composantes d'une matrice... 1 2 Le déterminant d'une matrice... 2 3 Calcul du déterminant pour une matrice... 2 4 Exercice...

Plus en détail

Statistique descriptive. Fabrice MAZEROLLE Professeur de sciences économiques Université Paul Cézanne. Notes de cours

Statistique descriptive. Fabrice MAZEROLLE Professeur de sciences économiques Université Paul Cézanne. Notes de cours Statistique descriptive Fabrice MAZEROLLE Professeur de sciences économiques Université Paul Cézanne Notes de cours Dernière mise à jour le mercredi 25 février 2009 1 ère année de Licence Aix & Marseille

Plus en détail

Thème 1: l environnement pédagogique et scolaire dans le primaire et le secondaire

Thème 1: l environnement pédagogique et scolaire dans le primaire et le secondaire FRANCE Cette note sur la France se focalise sur trois grands thèmes que l on retrouve dans cette édition de Regards sur l éducation et qui concernent plus particulièrement la France. Il s agit de l environnement

Plus en détail

Principaux partenaires commerciaux de l UE, 2002-2014 (Part dans le total des échanges de biens extra-ue, sur la base de la valeur commerciale)

Principaux partenaires commerciaux de l UE, 2002-2014 (Part dans le total des échanges de biens extra-ue, sur la base de la valeur commerciale) 55/2015-27 mars 2015 Commerce international de biens en 2014 Principaux partenaires commerciaux de l UE en 2014: les États-Unis pour les exportations, la Chine pour les importations Le commerce entre États

Plus en détail

Systèmes de transport public guidés urbains de personnes

Systèmes de transport public guidés urbains de personnes service technique des Remontées mécaniques et des Transports guidés Systèmes de transport public guidés urbains de personnes Principe «GAME» (Globalement Au Moins Équivalent) Méthodologie de démonstration

Plus en détail

PROFITEZ DE DONNÉES DE CLASSE MONDIALE. Creditsafe lance une suite de solutions conçues pour accompagner votre développement à l international

PROFITEZ DE DONNÉES DE CLASSE MONDIALE. Creditsafe lance une suite de solutions conçues pour accompagner votre développement à l international PROFITEZ DE DONNÉES DE CLASSE MONDIALE Creditsafe lance une suite de solutions conçues pour accompagner votre développement à l international Nous sommes fiers de vous présenter la nouvelle gamme de solutions

Plus en détail

DURÉE DE VIE ET DE. Michel JAMBU, Centre National d'etudes des Télécommunications France Direction scientifique

DURÉE DE VIE ET DE. Michel JAMBU, Centre National d'etudes des Télécommunications France Direction scientifique ESTIMATION ET PRÉDICTION DE LA FIDÉLITÉ, DE LA DURÉE DE VIE ET DE LA VALEUR ÉCONOMIQUE DES CLIENTS PAR DES TECHNIQUES DE DATAMINING Michel JAMBU, Centre National d'etudes des Télécommunications France

Plus en détail

CHAPITRE VIII : Les circuits avec résistances ohmiques

CHAPITRE VIII : Les circuits avec résistances ohmiques CHAPITRE VIII : Les circuits avec résistances ohmiques VIII. 1 Ce chapitre porte sur les courants et les différences de potentiel dans les circuits. VIII.1 : Les résistances en série et en parallèle On

Plus en détail

Le point sur les marchés des pensions. des pays de l OCDE OCDE

Le point sur les marchés des pensions. des pays de l OCDE OCDE CONSEIL D ORIENTATION DES RETRAITES Séance plénière du 17 décembre 2013 à 14h30 «Etat des lieux sur l épargne en prévision de la retraite» Document N 13 Document de travail, n engage pas le Conseil Le

Plus en détail

ELEMENTS DE COMPTABILITE NATIONALE

ELEMENTS DE COMPTABILITE NATIONALE ELEMENTS DE COMPTABILITE NATIONALE Cours de M. Di Roberto Université Victor Segalen Bordeaux 2 Bibliographie Ce cours s inspire largement des ouvrages essentiels suivants. Merci à leurs auteurs. BOSSERELLE

Plus en détail

ACP Voitures 1- Méthode

ACP Voitures 1- Méthode acp=princomp(voit,cor=t) ACP Voitures 1- Méthode Call: princomp(x = voit, cor = T) Standard deviations: Comp.1 Comp.2 Comp.3 Comp.4 Comp.5 Comp.6 2.1577815 0.9566721 0.4903373 0.3204833 0.2542759 0.1447788

Plus en détail

TRAITEMENT DES DONNEES MANQUANTES AU MOYEN DE L ALGORITHME DE KOHONEN

TRAITEMENT DES DONNEES MANQUANTES AU MOYEN DE L ALGORITHME DE KOHONEN TRAITEMENT DES DONNEES MANQUANTES AU MOYEN DE L ALGORITHME DE KOHONEN Marie Cottrell, Smaïl Ibbou, Patrick Letrémy SAMOS-MATISSE UMR 8595 90, rue de Tolbiac 75634 Paris Cedex 13 Résumé : Nous montrons

Plus en détail

MRK -6081 A : Méthodes d Analyse de Données en Marketing Automne 2010

MRK -6081 A : Méthodes d Analyse de Données en Marketing Automne 2010 E MRK -6081 A : Méthodes d Analyse de Données en Marketing Automne 2010 Professeure :Elissar Toufaily Plage horaire du cours : Cours en salle Jeudi 15h 30-18h30 Local 4221 PAP Du 2 septembre. 2010 au 9

Plus en détail

Régimes publics de retraite État de la situation. Perspectives des différents régimes publics de retraite. Plan

Régimes publics de retraite État de la situation. Perspectives des différents régimes publics de retraite. Plan Régimes publics de retraite État de la situation Perspectives des différents régimes publics de retraite 79 e congrès de l ACFAS 10 mai 2011 Plan Portrait des régimes publics de retraite La pression démographique

Plus en détail

TARIFICATION DES INSTRUMENTS FINANCIERS AU 01 JANVIER 2015

TARIFICATION DES INSTRUMENTS FINANCIERS AU 01 JANVIER 2015 TARIFICATION DES INSTRUMENTS FINANCIERS AU 01 JANVIER 2015 I. Organismes de Placements Collectifs 1. SICAV émises par la BCEE Sous réserve d exceptions éventuelles prévues dans le prospectus d émission,

Plus en détail

CAPTEURS - CHAINES DE MESURES

CAPTEURS - CHAINES DE MESURES CAPTEURS - CHAINES DE MESURES Pierre BONNET Pierre Bonnet Master GSI - Capteurs Chaînes de Mesures 1 Plan du Cours Propriétés générales des capteurs Notion de mesure Notion de capteur: principes, classes,

Plus en détail

La place de SAS dans l'informatique décisionnelle

La place de SAS dans l'informatique décisionnelle La place de SAS dans l'informatique décisionnelle Olivier Decourt ABS Technologies - Educasoft Formations La place de SAS dans l'informatique décisionnelle! L'historique de SAS! La mécanique! La carrosserie

Plus en détail

Séries Statistiques Simples

Séries Statistiques Simples 1. Collecte et Représentation de l Information 1.1 Définitions 1.2 Tableaux statistiques 1.3 Graphiques 2. Séries statistiques simples 2.1 Moyenne arithmétique 2.2 Mode & Classe modale 2.3 Effectifs &

Plus en détail

LA RÉDUCTION DU TEMPS DE TRAVAIL : UNE COMPARAISON DE LA POLITIQUE DES «35 HEURES» AVEC LES POLITIQUES D AUTRES PAYS MEMBRES DE L OCDE

LA RÉDUCTION DU TEMPS DE TRAVAIL : UNE COMPARAISON DE LA POLITIQUE DES «35 HEURES» AVEC LES POLITIQUES D AUTRES PAYS MEMBRES DE L OCDE LA RÉDUCTION DU TEMPS DE TRAVAIL : UNE COMPARAISON DE LA POLITIQUE DES «35 HEURES» AVEC LES POLITIQUES D AUTRES PAYS MEMBRES DE L OCDE par John P. Martin, Martine Durand et Anne Saint-Martin* Audition

Plus en détail

Les questions relatives aux finances publiques, longtemps réservées aux spécialistes, sont

Les questions relatives aux finances publiques, longtemps réservées aux spécialistes, sont CHAPITRE 1 LES FACTEURS STRUCTURELS DE LA HAUSSE DE L ENDETTEMENT PUBLIC DANS LES PAYS AVANCÉS Les questions relatives aux finances publiques, longtemps réservées aux spécialistes, sont revenues au cœur

Plus en détail

Âge effectif de sortie du marché du travail

Âge effectif de sortie du marché du travail Extrait de : Panorama des pensions 2013 Les indicateurs de l'ocde et du G20 Accéder à cette publication : http://dx.doi.org/10.1787/pension_glance-2013-fr Âge effectif de sortie du marché du travail Merci

Plus en détail

Le creusement des inégalités touche plus particulièrement les jeunes et les pauvres

Le creusement des inégalités touche plus particulièrement les jeunes et les pauvres LE POINT SUR LES INÉGALITÉS DE REVENU Le creusement des inégalités touche plus particulièrement les jeunes et les pauvres Résultats issus de la Base de données de l OCDE sur la distribution des revenus

Plus en détail

Master Marketing et Pratiques Commerciales Formation continue

Master Marketing et Pratiques Commerciales Formation continue Master Marketing et Pratiques Commerciales Formation continue 2014/2015 UE1 MARKETING OPÉRATIONNEL/CONCEPTS ET MÉTHODES Ouidade Sabri Familiariser les étudiants aux principaux concepts marketing; Comprendre

Plus en détail

Copropriété: 31, rue des Abondances 92100 Boulogne-Billancourt

Copropriété: 31, rue des Abondances 92100 Boulogne-Billancourt Eléments utilisés: Copropriété: 31, rue des Abondances 92100 Boulogne-Billancourt Notice explicative sur la ventilation de la facture EDF annuelle entre les différents postes de consommation à répartir

Plus en détail

Travaux pratiques avec RapidMiner

Travaux pratiques avec RapidMiner Travaux pratiques avec RapidMiner Master Informatique de Paris 6 Spécialité IAD Parcours EDOW Module Algorithmes pour la Fouille de Données Janvier 2012 Prise en main Généralités RapidMiner est un logiciel

Plus en détail

Statistiques Appliquées à l Expérimentation en Sciences Humaines. Christophe Lalanne, Sébastien Georges, Christophe Pallier

Statistiques Appliquées à l Expérimentation en Sciences Humaines. Christophe Lalanne, Sébastien Georges, Christophe Pallier Statistiques Appliquées à l Expérimentation en Sciences Humaines Christophe Lalanne, Sébastien Georges, Christophe Pallier Table des matières 1 Méthodologie expérimentale et recueil des données 6 1.1 Introduction.......................................

Plus en détail

CMC MARKETS UK PLC. Conditions Tarifaires CFDs. Plateforme Next Generation. Janvier 2015. RCS Paris: 525 225 918

CMC MARKETS UK PLC. Conditions Tarifaires CFDs. Plateforme Next Generation. Janvier 2015. RCS Paris: 525 225 918 CMC MARKETS UK PLC Conditions Tarifaires CFDs Plateforme Next Generation Janvier 2015 RCS Paris: 525 225 918 Société immatriculée en Angleterre sous le numéro 02448409 Société agréée et réglementée par

Plus en détail

modélisation solide et dessin technique

modélisation solide et dessin technique CHAPITRE 1 modélisation solide et dessin technique Les sciences graphiques regroupent un ensemble de techniques graphiques utilisées quotidiennement par les ingénieurs pour exprimer des idées, concevoir

Plus en détail

Premières estimations pour 2014 Le revenu agricole réel par actif en baisse de 1,7% dans l UE28

Premières estimations pour 2014 Le revenu agricole réel par actif en baisse de 1,7% dans l UE28 194/2014-15 décembre 2014 Premières estimations pour 2014 Le revenu agricole réel par actif en baisse de 1,7% dans l UE28 Par rapport à 2013, le revenu agricole réel par actif 1 a diminué de 1,7% dans

Plus en détail

RÉSOLUTION DE SYSTÈMES À DEUX INCONNUES

RÉSOLUTION DE SYSTÈMES À DEUX INCONNUES RÉSOLUTION DE SYSTÈMES À DEUX INCONNUES Sommaire 1 Méthodes de résolution... 3 1.1. Méthode de Substitution... 3 1.2. Méthode des combinaisons linéaires... 6 La rubrique d'aide qui suit s'attardera aux

Plus en détail

Communiqué de Lancement

Communiqué de Lancement Direction du Marketing Produits Sage - Division Mid Market Communiqué de Lancement Rapprochement Bancaire 1000 Produit : Rapprochement Bancaire 1000 Bases de Données : Oracle - MS/SQL Server Microsoft

Plus en détail

Le marché de l assurance de protection juridique en Europe. Octobre 2013

Le marché de l assurance de protection juridique en Europe. Octobre 2013 Le marché de l assurance de protection juridique en Europe Octobre 2013 Le marché de l assurance de protection juridique en Europe Octobre 2013 Dans sa dernière publication, RIAD, l Association internationale

Plus en détail