UNIVERSITÉ LUMIÈRE LYON 2 UFR DE SCIENCES ÉCONOMIQUES ET DE GESTION. M1- Economie quantitative. Analyse des données

Save this PDF as:
 WORD  PNG  TXT  JPG

Dimension: px
Commencer à balayer dès la page:

Download "UNIVERSITÉ LUMIÈRE LYON 2 UFR DE SCIENCES ÉCONOMIQUES ET DE GESTION. M1- Economie quantitative. Analyse des données"

Transcription

1 UNIVERSITÉ LUMIÈRE LYON 2 UFR DE SCIENCES ÉCONOMIQUES ET DE GESTION M1- Economie quantitative Analyse des données Polycopié 2 : Classification automatique Année Universitaire Courriel ;

2 Introduction Les techniques de classification 1 automatique constituent le deuxième volet des méthodes d'analyse des données, elles ont pour objectif de structurer les individus (objets). Cette approche consiste à faire des regroupements les moins arbitraires possibles des individus à partir de leurs caractères de description. La classification automatique est un terme générique pour des méthodes d'analyse des données permettant de traiter de grands tableaux de données rectangulaires, où les lignes représentent généralement les individus et les colonnes des caractères ou des questions. Le but de telles techniques est de découvrir des structures cachées de l ensemble des individus, ces structures étant des groupes ou des hiérarchies de groupes emboîtés. Elles visent à mettre en évidence des groupes d'individus aussi homogènes que possible, c est-à-dire que les individus soient très ressemblants entre eux, tandis que deux individus appartenant à des groupes différents doivent être très dissemblants. Les classes de la classification regroupent des individus ayant des caractéristiques (variables) similaires et séparent les individus ayant des caractéristiques différentes : homogénéité interne et hétérogénéité externe. Enfin, ces groupes d'individus sont obtenus au moyen d'algorithmes formalisés. Il n'y a pas de classification parfaite et c'est seulement dans une optique déterminée ou en vue d'une application bien précise que telle classification peut être considérée comme meilleure que telle autre. Les opération dites de typologie, de segmentation ou de classification (qui sont toutes des "partitions" répétées d'un ensemble au sens mathématique du mot) doivent toujours être considérées étroitement liées à l'ensemble des caractères actifs choisis pour définir le thème. Les techniques de classification présentent une synthèse des données différente de celle des techniques factorielles : il y a complémentarité entre les deux approches. Les regroupements peuvent en effet permettre de corriger les déformations opérées lors des projections des individus sur les plans factoriels. En général, pour aller au delà de l'interprétation des premiers axes factoriels, on enchaîne commodément une classification sur l'ensemble des individus caractérisés par leurs premières coordonnées factorielles. On distingue deux types de méthodes de classification : - les méthodes non hiérarchiques (nuées dynamiques) qui produisent directement une partition en un nombre de classes fixé par l'utilisateur, - les méthodes hiérarchiques qui produisent des suites de partitions en classes de plus en plus vastes. Contrairement aux méthodes factorielles, les méthodes de classification ne sont pas déterministes (les différentes méthodes peuvent mener à des résultats très différents, et même certaines méthodes peuvent fournir plusieurs résultats). Ces méthodes dépendent toutes d'une notion de distance. D une part, pour regrouper les individus et d autre part, pour regrouper un individu avec un groupe d'individus. Le choix de ces distances peut fortement influencer les résultats de la méthode, et il n'y a pas de distance qui soit meilleure que toutes les autres. Les deux méthodes de classification qui seront présentées optimisent localement un critère de type inertie. Un critère usuel de classification consiste à chercher la partition telle que l inertie intraclasse soit minimale pour avoir en moyenne des classes bien homogènes, ce qui revient à maximiser l inertie interclasse. La classification est une méthode descriptive et non prédictive. 1 Clustering, segmentation ou typologie (marketing), nosologie (médecine), taxinomie ou taxonomie (biologie et zoologie) M1 : Economie Quantitative Analyse des Données - 2 -

3 1. Classification non hiérarchique Les regroupements d'individus se font par une recherche directe d'une partition, en affectant les individus à des centres provisoires de groupes, puis en recentrant ces groupes, et en affectant de façon itérative ces individus ( méthode d agrégation autour des centres mobiles ). L utilisateur choisit le nombre de classes à obtenir et une partition initiale. Cette partition initiale peut être tirée au hasard ou bien représenter une répartition plausible des individus en groupes obtenue empiriquement ou par d autres méthodes. L algorithme réitère alors deux étapes successives, une étape de recentrage et une étape de réaffectation. Méthode des nuées dynamiques Pour obtenir efficacement une partition des données, la méthode des nuées dynamiques est la plus utilisée, c est une variante de la méthode des centres mobiles, à savoir qu au lieu de faire un recentrage dès qu un individu change de classe, la méthode des nuées dynamiques effectue un recentrage global après que tous les individus aient été réaffectés. Les deux principales étapes de la méthode : - une étape de recentrage : l'individu moyen de chaque groupe ( centre de classe ) est redéfini en fonction des individus qui lui sont affectés, - une étape d'affectation : chaque individu est placé dans le groupe dont le centre de classe est le plus proche. Ces deux étapes sont répétées jusqu à ce qu'il n'y ait plus de réaffectation c est-à-dire obtenir la stabilité des classes ou encore lorsque l une de ces étapes ne produit plus de modification dans la composition des classes d individus. Cette méthode présente plusieurs particularités : - selon le choix initial des centres des classes, on aboutit à des résultats différents en effet la solution obtenue n'est pas forcément la solution optimale, - le nombre de classes désiré n'est pas déterminé par la méthode mais par l'utilisateur. Il en résulte que les résultats ne sont pas nécessairement optimaux ( à l'heure actuelle, il n'existe aucune méthode optimale nécessitant un temps de calcul raisonnable ). En pratique, pour pallier à ce défaut, on effectue plusieurs essais et l on retient la partition optimale qui présente l inertie intraclasse minimale. 2 Classification Hiérarchique Les méthodes hiérarchiques cherchent à établir des groupes d individus dont les regroupements se font par agglomération progressive des individus similaires puis des assemblages de groupes formant des super-groupes eux mêmes réunis dans des classes plus hétérogènes, etc. On distingue 2 types de classification hiérarchique (ascendante ou descendante). Dans les 2 cas, on obtient une classification des n individus en 1,2,..,n groupes; ces classifications étant emboîtées les unes dans les autres. Un arbre hiérarchique, ou dendogramme, est dessiné pour représenter ces emboîtements de groupes d individus. Les deux types de classification hiérarchique possibles; ascendante ou descendante, correspondent au sens dans lequel l'arbre est construit. 2.1 Classification Hiérarchique Ascendante La Classification Hiérarchique Ascendante (CHA) dite «agglomérative» est un algorithme «ascendant» qui procède par regroupements successifs des individus en vue de fournir une hiérarchie de partitions. A l'initialisation, cette méthode considère que chaque individu constitue un groupe à lui tout seul. M1 : Economie Quantitative Analyse des Données - 3 -

4 Etape 1, parmi les n individus à classer, on cherche les 2 individus les plus proches 'semblables', que l on regroupe. Ces deux individus sont ensuite agrégés en un nouveau groupe. Etape 2, on calcule les distances entre le nouveau groupe et les individus restants. La configuration est identique à celle de l étape 1, à la différence près que l on a seulement n-1 individus à classer. Ainsi de suite, on cherche de nouveau les 2 individus ou groupes d individus les plus proche, que l on agrège et ainsi jusqu à ce qu il n y ait plus qu un seul groupe d individus. Les différents regroupements d individus obtenus sont présentés sous la forme d une arborescence. A noter que cette méthode est basée sur le critère de Ward qui consiste, à chaque étape de regroupement ou d agrégation, à rendre minimale la perte d inertie interclasse résultant de l agrégation de deux individus ou encore d un individu à un groupe d individus. La figure ci-dessous représente la suite de partitions d'un ensemble de 5 individus. Les individus ou objets (I1, I2, I3, I4, I5) sont les éléments terminaux de l'arbre (ou de la hiérarchie). Les classes d'individus (6), (7), (8), (9) sont les noeuds de l'arbre : ce sont des classes issues de regroupements de deux éléments numérotés à la suite des éléments terminaux et dont chacune détermine une nouvelle partition. Les éléments groupés constituant un noeud sont appelés aîné et benjamin. Arbre hiérarchique br e : dendogramme h iér ar c hiq ue : den do gr a m m e (9) Noeud Effectif Aîné Benjamin (9) (8) (7) (6) (7) I1 I3 I2 (8) (7) I4 I5 «coupure» Partition en 2 classes Classe 1 (8) (7) (6) &&1& &&2& &&4& &&3& &&5& Classe 2 I1 I3 I4 I2 I5 (1) (2) (3) (4) (5) Eléments terminaux de l arbre A la 1 étape : I2 et I5 sont regroupés à la 2 étape : I3 et I4 sont regroupés à la 3 étape : I1 et I3+I4 sont regroupés à la 4 étape : I1+I3+I4 et I2+I5 sont regroupés L'avantage de la méthode hiérarchique par rapport à la méthode des nuées dynamiques est qu'il n'est pas nécessaire de spécifier le nombre de groupes désirés. Les partitions sont obtenues en tronquant l'arbre à un niveau quelconque par une droite horizontale. Par exemple, pour obtenir une partition en 2 classes, on tronque l'arbre au niveau du noeud (8) : 1 ère classe {I1, I3, I4} à 3 individus, la 2 ème classe {I2, I5} à 2 individus. A chaque niveau, où ont lieu les regroupements, correspond une valeur numérique appelée "indice d'agrégation" ; plus cet indice est élevé, plus les classes d'individus regroupés sont hétérogènes. Plus les individus se regroupent au bas de l'arbre hiérarchique, plus ils se ressemblent au sens de l indice de Ward. Une partition est d'autant plus fine que la coupure de l'arbre est proche des éléments terminaux. M1 : Economie Quantitative Analyse des Données - 4 -

5 2.2 Classification hiérarchique descendante La Classification Hiérarchique Descendante (CHD) dite «divisive» est une méthode inverse de la précédente. Les classes sont créées de proche en proche, on considère initialement que tous les individus appartiennent à une même classe, et successivement on découpe en 2 la classe la plus dispersée jusqu'à ce que l'on obtienne autant de classes que d'individus. 2.3 Exemples de classification hiérarchique Les données ( Principaux indicateurs économiques et financiers de UE-2000 ) Reprenons l'exemple des indicateurs économiques et financiers des 15 pays de l Union Européenne traité en Analyse en Composantes Principales (ACP). L'objectif est de structurer cet ensemble de pays et de mettre en évidence des groupes de pays les plus proches possibles en fonction des variables actives du thème Finances publiques ( interprétation interne des classes de la partition obtenue ). L information supplémentaire apportée par la variable qualitative Etat membre et toutes autres variables quantitatives sont présentées comme variables illustratives ( interprétation externe des classes de la partition obtenue ). M1 : Economie Quantitative Analyse des Données - 5 -

6 SELECTION DES INDIVIDUS ET DES VARIABLES UTILES VARIABLES CONTINUES ACTIVES 4 VARIABLES 4. Recettes totales des APU ( CONTINUE ) 5. Dépenses totales des APU ( CONTINUE ) 6. Solde des finances publiques ( CONTINUE ) 7. Dette brute des APU ( CONTINUE ) VARIABLES NOMINALES ILLUSTRATIVES 1 VARIABLES 3 MODALITES ASSOCIEES 1. Etat membre ( 3 MODALITES ) VARIABLES CONTINUES ILLUSTRATIVES 6 VARIABLES 2. Population (%) UE-2000 ( CONTINUE ) 3. Produit Intérieur Brut (%) UE-2000 ( CONTINUE ) 8. Taux de chômage en % population active ( CONTINUE ) 9. Ventes au détail en volume (%) ( CONTINUE ) 10. Production industrielle hors bâtiment ( CONTINUE ) 11. Taux de croissance en volume du PIB ( CONTINUE ) INDIVIDUS NOMBRE POIDS POIDS DES INDIVIDUS: Poids des individus, uniforme egal a 1. UNIF RETENUS... NITOT = 17 PITOT = SELECTION APRES FILTRAGE ACTIFS... NIACT = 15 PIACT = SUPPLEMENTAIRES... NISUP = 2 PISUP = Résultats Les variables continues du thème Finances publiques des 15 pays de l UE a fait l objet d une analyse typologique, Classification Hiérarchique Ascendante (CHA), sur les premières composantes principales de l ACP afin de mettre en évidence des groupes de pays aussi homogènes que possible à partir de leurs finances publiques Description des classes de la partition Caractéristiques En inscrivant l analyse dans une démarche de type «thèmascope 2» ou analyse structurelle des données, une Classification Hiérarchique Ascendante a donc été réalisée à partir des deux premières composantes principales significatives de l ACP du thème Finances publiques. Ces deux premières composantes principales, qui restituent environ 90% de l information initiale, ont été retenues pour l analyse typologique. Quatre classes ont été identifiées à partir de l arbre hiérarchique (dendogramme) ci-dessous. Classification Hiérarchique Ascendante - Finances publiques Luxembourg Finlande Suède Danemark Royaume-Uni Pays-bas Espagne Portugal Irlande Allemagne Autriche Italie Belgique Grèce France 2 Technique d exploration des données mettant en pratique des méthodes d analyse de données connues, dans un contexte méthodologique en fonction de l objectif recherché et de la nature des variables retenues. M1 : Economie Quantitative Analyse des Données - 6 -

7 CLASSIFICATION HIERARCHIQUE (VOISINS RECIPROQUES) SUR LES 2 PREMIERS AXES FACTORIELS DESCRIPTION DES NOEUDS NUM. AINE BENJ EFF. POIDS INDICE HISTOGRAMME DES INDICES DE NIVEAU * * ** ** *** *** **** ****** ****** ******* ********************** ****************************** ***************************************************************************** ********************************************************************************* SOMME DES INDICES DE NIVEAU = NOUVEL ORDRE DES INDIVIDUS : NOUVEAU, NUMERO ET IDENTIFICATEURD'ORIGINE Fran Grèc Belg Ital Autr Alle Irla Port Espa Pays Roya Dane Suèd Finl Luxe DESCRIPTION DES NOEUDS DE LA HIERACHIE (INDICES EN POURCENTAGE DE LA SOMME DES INDICES : ) NOEUD SUCCESSEURS COMPOSITION NUMERO INDICE AINE BENJ EFFECT. POIDS PREMIER DERNIER PARTITION PAR COUPURE D'UN ARBRE HIERARCHIQUE Coupure 'a' de l'arbre en 4 classes FORMATION DES CLASSES (INDIVIDUS ACTIFS) DESCRIPTION SOMMAIRE CLASSE EFFECTIF POIDS CONTENU aa1a A 6 aa2a A 11 aa3a A 13 aa4a A COORDONNEES ET VALEURS-TEST AVANT CONSOLIDATION AXES 1 A CLASSES VALEURS-TEST COORDONNEES IDEN - LIBELLE EFF. P.ABS DISTO Coupure 'a' de l'arbre en 4 classes aa1a - CLASSE 1 / aa2a - CLASSE 2 / aa3a - CLASSE 3 / aa4a - CLASSE 4 / CONSOLIDATION DE LA PARTITION AUTOUR DES 4 CENTRES DE CLASSES, REALISEE PAR 10 ITERATIONS A CENTRES MOBILES PROGRESSION DE L'INERTIE INTER-CLASSES ITERATION I.TOTALE I.INTER QUOTIENT ARRET APRES L'ITERATION 2 L'ACCROISSEMENT DE L'INERTIE INTER-CLASSES PAR RAPPORT A L'ITERATION PRECEDENTE N'EST QUE DE %. DECOMPOSITION DE L'INERTIE CALCULEE SUR 2 AXES INERTIES EFFECTIFS POIDS DISTANCES INERTIES AVANT APRES AVANT APRES AVANT APRES AVANT APRES INTER-CLASSES INTRA-CLASSE CLASSE 1 / CLASSE 2 / CLASSE 3 / CLASSE 4 / TOTALE QUOTIENT (INERTIE INTER / INERTIE TOTALE) : AVANT APRES M1 : Economie Quantitative Analyse des Données - 7 -

8 COORDONNEES ET VALEURS-TEST APRES CONSOLIDATION AXES 1 A CLASSES VALEURS-TEST COORDONNEES IDEN - LIBELLE EFF. P.ABS DISTO Coupure 'a' de l'arbre en 4 classes aa1a - CLASSE 1 / aa2a - CLASSE 2 / aa3a - CLASSE 3 / aa4a - CLASSE 4 / COMPOSITION DE: Coupure 'a' de l'arbre en 4 classes CLASSE 1 / 4 France Allemagne Autriche Belgique Grèce Italie CLASSE 2 / 4 Espagne Irlande Pays-bas Portugal Royaume-Uni CLASSE 3 / 4 Danemark Suède CLASSE 4 / 4 Finlande Luxembourg APPARTENANCE DE CHAQUE INDIVIDU A: Coupure 'a' de l'arbre en 4 classes France : 1 Allemagne : 1 Autriche : 1 Belgique : 1 Espagne : 2 Finlande : 4 Grèce : 1 Irlande : 2 Italie : 1 Luxembourg : 4 Pays-bas : 2 Portugal : 2 Danemark : 3 Royaume-Uni : 2 Suède : 3 INDIVIDUS ILLUSTRATIFS AFFECTATION DANS LES CLASSES CLASSE EFFECTIF POIDS CLASSE CLASSE CLASSE CLASSE COMPOSITION DE: Coupure 'a' de l'arbre en 4 classes CLASSE 1 / 4 CLASSE 2 / 4 CLASSE 3 / 4 CLASSE 4 / 4 Japon Etats-Unis APPARTENANCE DE CHAQUE INDIVIDU A: Coupure 'a' de l'arbre en 4 classes Etats-Unis : 2 Japon : 1 3 L'analyse d'une partition - Description statistique des classes de la partition Une fois que l'on a choisi une partition, il reste à préciser quelles sont les variables actives qui sont à l'origine des regroupements observés. Sachant que les individus d'une classe se ressemblent vis-à-vis de l'ensemble des caractéristiques actives choisies pour les décrire, on procède alors à une description automatique des classes qui constitue en pratique une étape indispensable de toute procédure de classification. Les aides à l'interprétation, afin de donner un profil significatif de chaque classe, sont généralement basées sur des comparaisons de moyennes ( variables continues ) ou de pourcentages ( variables qualitatives ) à l'intérieur des classes avec les moyennes ou les pourcentages obtenus sur l'ensemble des caractéristiques des individus à classer. Pour sélectionner les variables continues ou les modalités des variables nominales les plus caractéristiques de chaque classe, on mesure l'écart entre les valeurs relatives à la classe et les valeurs globales. Ces statistiques d'écarts sont résumées par un critère appelé valeur-test qui permet de ranger les variables par ordre d'intérêt, et de désigner ainsi les variables les plus caractéristiques et donc significatives de la classe. Les tableaux suivant donnent la description statistique des 4 classes de la partition retenue à partir des variables quantitatives actives c est-à-dire l interprétation interne et éventuellement quantitatives illustratives (interprétation externe). Le profil-type de chaque classe est présenté à partir de résultats significatifs ( V.TEST > 1.96 équivalent à PROB < 5%) de comparaisons de moyennes dans la classe (CLASSE) et hors de la classe (GENERALE). M1 : Economie Quantitative Analyse des Données - 8 -

9 DESCRIPTION DE PARTITION(S) DESCRIPTION DE LA Coupure 'a' de l'arbre en 4 classes CARACTERISATION PAR LES CONTINUES DES CLASSES OU MODALITES DE Coupure 'a' de l'arbre en 4 classes CLASSE 1 / 4 V.TEST PROBA MOYENNES ECARTS TYPES VARIABLES CARACTERISTIQUES CLASSE GENERALE CLASSE GENERAL NUM.LIBELLE IDEN CLASSE 1 / 4 ( POIDS = 6.00 EFFECTIF = 6 ) aa1a Dette brute des APU DETB Dépenses totales des APU DEPE Solde des finances publiques SDFP CLASSE 2 / 4 V.TEST PROBA MOYENNES ECARTS TYPES VARIABLES CARACTERISTIQUES CLASSE GENERALE CLASSE GENERAL NUM.LIBELLE IDEN CLASSE 2 / 4 ( POIDS = 5.00 EFFECTIF = 5 ) aa2a Dépenses totales des APU DEPE Recettes totales des APU RECE CLASSE 3 / 4 V.TEST PROBA MOYENNES ECARTS TYPES VARIABLES CARACTERISTIQUES CLASSE GENERALE CLASSE GENERAL NUM.LIBELLE IDEN CLASSE 3 / 4 ( POIDS = 2.00 EFFECTIF = 2 ) aa3a Recettes totales des APU RECE Dépenses totales des APU DEPE CLASSE 4 / 4 V.TEST PROBA MOYENNES ECARTS TYPES VARIABLES CARACTERISTIQUES CLASSE GENERALE CLASSE GENERAL NUM.LIBELLE IDEN CLASSE 4 / 4 ( POIDS = 2.00 EFFECTIF = 2 ) aa4a Solde des finances publiques SDFP Taux de croissance en volume du PIB TCRO Dette brute des APU DETB CARACTERISATION PAR LES MODALITES DES CLASSES OU MODALITES DE Coupure 'a' de l'arbre en 4 classes CLASSE 1 / 4 V.TEST PROBA ---- POURCENTAGES ---- MODALITES IDEN POIDS CLA/MOD MOD/CLA GLOBAL CARACTERISTIQUES DES VARIABLES CLASSE 2 / 4 V.TEST PROBA ---- POURCENTAGES ---- MODALITES IDEN POIDS CLA/MOD MOD/CLA GLOBAL CARACTERISTIQUES DES VARIABLES CLASSE 3 / 4 V.TEST PROBA ---- POURCENTAGES ---- MODALITES IDEN POIDS CLA/MOD MOD/CLA GLOBAL CARACTERISTIQUES DES VARIABLES CLASSE 3 / 4 aa3a UENM : Zone Non uro Etat membre UE UEM-Zone Euro Etat membre ZE 12 CLASSE 4 / 4 V.TEST PROBA ---- POURCENTAGES ---- MODALITES IDEN POIDS CLA/MOD MOD/CLA GLOBAL CARACTERISTIQUES DES VARIABLES Dans le cas de variables qualitatives, les aides à l interprétation des modalités illustratives sont basées sur des comparaisons de pourcentages de la modalité dans la classe (FRE / CLA) et hors de la classe (GLOBAL). Mais cette comparaison est insuffisante : il faut tenir compte du degré d inclusion de la classe dans la modalité (CLAS / MOD). On mesure alors l écart entre les valeurs relatives à la classe et les valeurs globales. Ces statistiques sont converties en un critère de valeur-test 3 (V.TEST) permettant d opérer un tri sur les modalités des variables, et de présenter dans un ordre décroissant les modalités illustratives représentatives, avec un risque d erreur (PROB) inférieur à 5%. 3 Comparaison d effectifs dans le cadre d une loi hypergéométrique transformée en nombre d écart-types d une loi normale centrée réduite. La valeur absolue de la valeur-test est l analogue de la valeur absolue d une variable normale centrée réduite. M1 : Economie Quantitative Analyse des Données - 9 -

10 CARACTERISATION PAR LES AXES DES CLASSES OU MODALITES DE Coupure 'a' de l'arbre en 4 classes CLASSE 1 / 4 AXES CARACTERISTIQUES COORDONNEE COS.CARRE VALEUR-TEST PROBABILITE aa1a - CLASSE 1 / 4 ( POIDS = 6.00 EFFECTIF = 6 ) AXE AXE CLASSE 2 / 4 AXES CARACTERISTIQUES COORDONNEE COS.CARRE VALEUR-TEST PROBABILITE aa2a - CLASSE 2 / 4 ( POIDS = 5.00 EFFECTIF = 5 ) AXE CLASSE 3 / 4 AXES CARACTERISTIQUES COORDONNEE COS.CARRE VALEUR-TEST PROBABILITE aa3a - CLASSE 3 / 4 ( POIDS = 2.00 EFFECTIF = 2 ) AXE CLASSE 4 / 4 AXES CARACTERISTIQUES COORDONNEE COS.CARRE VALEUR-TEST PROBABILITE aa4a - CLASSE 4 / 4 ( POIDS = 2.00 EFFECTIF = 2 ) AXE Interprétation La première classe, représentant 40% de l ensemble des 15 pays actifs de l UE à classer, regroupe les pays dont la dette brute et les dépenses totales des APU sont significativement importantes et un faible solde des finances publiques. Elle est composée de la France, de la Grèce, de la Belgique, de l Italie, de l Autriche et de l Allemagne. La deuxième classe regroupe cinq pays dont les dépenses et les recettes totales des APU sont significativement plus faible, relativement à la moyenne de l ensemble des pays de l UE15. A l opposé de la deuxième classe, les pays dont les dépenses et les recettes totales des APU sont regroupées dans la troisième classe : le Danemark et la Suède. Ce sont plutôt des pays de l UE : Zone Non uro. Enfin, la quatrième classe est composée de deux pays, la Finlande et le Luxembourg, caractérisés par un fort solde des finances publiques et une faible dette brute des APU. De plus, c est plutôt une classe de pays dont le taux de croissance en volume du PIB est significativement élevé relativement au taux moyen de l ensemble des pays de l UE15. Sur le graphique de la figure 1, on peut visualiser les positions des 15 pays de l Union et des quatre centres de classes de la partition, sur le premier plan factoriel de l ACP. On peut également visualiser les proximités entre les pays illustratifs (Japon et Etats-Unis) et les centres des classes de la partition. M1 : Economie Quantitative Analyse des Données

11 Figure 1 : Individus actifs et illustratifs - Partition Sur le même principe que dans une analyse factorielle (figure 2), les variables illustratives qui n'ont pas contribué à la construction des classes, peuvent participer à la description des classes (interprétation externe). Ces variables permettent a posteriori d'identifier et de caractériser les regroupements établis à partir des variables actives. Figure 2 : Modalités de la variable illustrative Etat membre & Partition M1 : Economie Quantitative Analyse des Données

12 4. Partition ou hiérarchie? Quand faut-il utiliser l'une plutôt que l'autre? Par construction, une hiérarchie définit une suite de partitions. C'est donc une structure plus riche mais plus compliquée qu'une partition. D'autant plus que la plupart du temps l'utilisateur ne retient que quelques partitions d'une hiérarchie. Pourquoi ne pas rechercher directement une partition? L'examen de l'arbre hiérarchique est un moyen de déterminer un nombre de classes raisonnable, problème toujours difficile en classification. La méthode hiérarchique est très sensible aux effets de chaînes : elle peut regrouper des individus très différents s'il existe une suite d'individus proches 2 à 2 les reliant. De plus, elle n'est applicable que lorsque le nombre d'individus est petit (inférieur à 50) de telle sorte à présenter l'arbre hiérarchique. Lorsque le nombre d'individus est trop élevé, on recourra plutôt à des méthodes de partitionnement (nuées dynamiques) ; ces méthodes permettent de traiter rapidement de grands ensembles d'individus mais elles supposent que le nombre de classes est fixé a priori. Il faut alors réessayer plusieurs fois la méthode avec un nombre de classes différent, afin d'arriver à une partition qui corresponde au mieux à la configuration véritable du nuage des individus ( améliorer la valeur du critère d'inertie ). D'une manière générale, il est recommandé d utiliser la stratégie analyse factorielle + classification car les deux approches sont complémentaires pour une meilleure interprétation globale. De plus l'analyse factorielle permettant en outre d'interpréter rapidement en fonction des variables actives les regroupements obtenus par une classification. Le fait d abandonner une partie de l information initiale en ne conservant qu un nombre restreint d axes factoriels, loin d être un inconvénient, peut se révéler avantageux en éliminant les fluctuations aléatoires pouvant masquer les phénomènes importants. L analyse factorielle agit alors comme un filtre préservant l information utile. Par contre si on veut tenir compte de toute l'information (classification globale), il suffit de sélectionner pour la classification l'ensemble des axes factoriels qui résument l'information totale. Enfin, on peut transformer ( archiver ) les résultats d une classification en k classes en une question ( variable qualitative à k modalités ) afin de l utiliser pour d autres traitements. M1 : Economie Quantitative Analyse des Données

GUIDE DU DATA MINER. Classification - Typologies. Data Management, Data Mining, Text Mining

GUIDE DU DATA MINER. Classification - Typologies. Data Management, Data Mining, Text Mining GUIDE DU DATA MINER Classification - Typologies Data Management, Data Mining, Text Mining 1 Guide du Data Miner Classification - Typologies Le logiciel décrit dans le manuel est diffusé dans le cadre d

Plus en détail

La classification 2012-2013. Fabien Chevalier Jérôme Le Bellac

La classification 2012-2013. Fabien Chevalier Jérôme Le Bellac La classification 2012-2013 Fabien Chevalier Jérôme Le Bellac Introduction : Classification : méthode d analyse de données Objectif : Obtenir une représentation schématique simple d'un tableau de données

Plus en détail

Analyse en Composantes Principales avec XLSTAT

Analyse en Composantes Principales avec XLSTAT Analyse en Composantes Principales avec XLSTAT Une feuille Excel contenant à la fois les données et les résultats peut-être téléchargée en cliquant ici. Les données proviennent du US Census Bureau (le

Plus en détail

UNIVERSITÉ LUMIÈRE LYON 2 FACULTÉ DE SCIENCES ÉCONOMIQUES ET DE GESTION

UNIVERSITÉ LUMIÈRE LYON 2 FACULTÉ DE SCIENCES ÉCONOMIQUES ET DE GESTION UNIVERSITÉ LUMIÈRE LYON 2 FACULTÉ DE SCIENCES ÉCONOMIQUES ET DE GESTION Economie quantitative Master 2-ECOSMA Etudes et COnseil en Stratégie et MArketing Analyse des données Polycopié 1 : Méthodes factorielles

Plus en détail

L analyse en composantes principales en pratique

L analyse en composantes principales en pratique L analyse en composantes principales en pratique Après avoir vu sa formalisation mathématique dans le module précédent, on s intéresse ici à l utilisation pratique de l ACP. 1 Objectifs L objectif de l

Plus en détail

Heureusement, le tableau ci-dessus est complété par l'histogramme ci-dessous où un centimètre carré représente 10 jours.

Heureusement, le tableau ci-dessus est complété par l'histogramme ci-dessous où un centimètre carré représente 10 jours. Exercice 1 Le comptable des Tacauds Blancois vient de comptabiliser le nombre de passagers transportés par les taxis de son entreprise pour chaque jour de l'année 2011. Pour que son travail soit plus compréhensible

Plus en détail

Classification Exemple : Enquête d opinion sur les OGM. Pauline Le Badezet Alexandra Lepage

Classification Exemple : Enquête d opinion sur les OGM. Pauline Le Badezet Alexandra Lepage Classification Exemple : Enquête d opinion sur les OGM Pauline Le Badezet Alexandra Lepage SOMMAIRE Introduction Méthodologie Méthode de partitionnement Classification Ascendante Hiérarchique Interprétation

Plus en détail

Chapitre 1 GRAPHIQUES

Chapitre 1 GRAPHIQUES Statistique appliquée à la gestion et au marketing http://foucart.thierry.free.fr/statpc Chapitre 1 GRAPHIQUES On entend souvent qu un schéma vaut mieux qu un long discours. Effectivement, lorsque l on

Plus en détail

Chapitre 3 Dénombrement et représentation d un caractère continu. Lætitia Perrier Bruslé Cours de statistique descriptive sous Excel

Chapitre 3 Dénombrement et représentation d un caractère continu. Lætitia Perrier Bruslé Cours de statistique descriptive sous Excel Chapitre 3 Dénombrement et représentation d un caractère continu Lætitia Perrier Bruslé Cours de statistique descriptive sous Excel Introduction Un caractère quantitatif est continu si ses modalités possibles

Plus en détail

EXEMPLE D ANALYSE DES CORRESPONDANCES MULTIPLES COMPARAISON DE RACES DE CHIENS

EXEMPLE D ANALYSE DES CORRESPONDANCES MULTIPLES COMPARAISON DE RACES DE CHIENS EXEMPLE D ANALYSE DES CORRESPONDANCES MULTIPLES COMPARAISON DE RACES DE CHIENS On a réalisé une analyse des correspondances multiples en utilisant comme variables actives les six premières variables du

Plus en détail

Le système d éducation secondaire luxembourgeois : une analyse coûts/bénéfices

Le système d éducation secondaire luxembourgeois : une analyse coûts/bénéfices CHAMBRE DE COMMERCE LUXEMBOURG Actualité & tendances n 16 Le système d éducation secondaire luxembourgeois : une analyse coûts/bénéfices 20 octobre 2014 1 CHAMBRE DE COMMERCE LUXEMBOURG Sommaire 1. Actualité

Plus en détail

MÉTHODES DE CLASSIFICATION

MÉTHODES DE CLASSIFICATION MÉTHODES DE CLASSIFICATION Pierre-Louis GONZALEZ MÉTHODES DE CLASSIFICATION Objet Opérer des regroupements en classes homogènes d un ensemble d individus. Données Les données se présentent en général sous

Plus en détail

UE-27 : quelles prévisions de croissance économique en 2012 et 2013?

UE-27 : quelles prévisions de croissance économique en 2012 et 2013? ACTUALITÉS EUROPÉENNES n 49 janvier 2012 UE-27 : quelles prévisions de croissance économique en 2012 et 2013? par Pierre Verluise, Directeur de recherche à l IRIS, Directeur du site géopolitique www.diploweb.com

Plus en détail

Panorama du marché du Crédit à la consommation en Europe en 2013

Panorama du marché du Crédit à la consommation en Europe en 2013 Panorama du marché du Crédit à la consommation en Europe en 2013 Pour la 7 ème année consécutive, Crédit Agricole Consumer Finance publie son étude annuelle sur l état du marché du crédit à la consommation

Plus en détail

Statistiques descriptives (1/2)

Statistiques descriptives (1/2) Statistiques descriptives (1/2) Anita Burgun 2011-2012 http://www.med.univ-rennes1.fr Introduction! Statistique: méthode scientifique qui consiste à réunir des données chiffrées sur des ensembles d individus

Plus en détail

Prof.É.D.Taillard. Classification automatique @Prof. E. Taillard 1 EIVD, Informatique logiciel, 4 e semestre

Prof.É.D.Taillard. Classification automatique @Prof. E. Taillard 1 EIVD, Informatique logiciel, 4 e semestre INFORMATIQUE ORIENTATION LOGICIELS CLASSIFICATION AUTOMATIQUE Prof.É.D.Taillard Classification automatique @Prof. E. Taillard EIVD, Informatique logiciel, 4 e semestre CLASSIFICATION AUTOMATIQUE But :

Plus en détail

Sommaire. Les pourcentages. Les suites. Statistiques. Les probabilités. Descriptif de l épreuve... Conseils pour l épreuve...

Sommaire. Les pourcentages. Les suites. Statistiques. Les probabilités. Descriptif de l épreuve... Conseils pour l épreuve... Sommaire Descriptif de l épreuve............................................. Conseils pour l épreuve............................................ Les pourcentages FICHES Pages 1 Pourcentage Proportions....................................7

Plus en détail

Distance et classification. Cours 4: Traitement du signal et reconnaissance de forme

Distance et classification. Cours 4: Traitement du signal et reconnaissance de forme Distance et classification Cours 4: Traitement du signal et reconnaissance de forme Plan Introduction Pré-traitement Segmentation d images Morphologie mathématique Extraction de caractéristiques Classification

Plus en détail

Analyse de spectres d absorbance pour la prédiction des taux de moisissure, de matières grasses et de protéines d échantillons de viande

Analyse de spectres d absorbance pour la prédiction des taux de moisissure, de matières grasses et de protéines d échantillons de viande Université de Nantes M2 Ingénierie Mathématiques Rapport de chimiométrie Analyse de spectres d absorbance pour la prédiction des taux de moisissure, de matières grasses et de protéines d échantillons de

Plus en détail

Introduction sur l analyse en composantes principales (ACP)

Introduction sur l analyse en composantes principales (ACP) Introduction sur l analyse en composantes principales (CP) ) Introduction sur un exemple à 2 dimensions On veut représenter graphiquement les profils d élèves qui ont été notés sur 2 matières (Français

Plus en détail

L analyse Factorielle des correspondances. 1/ Préambule descriptif de l AFC

L analyse Factorielle des correspondances. 1/ Préambule descriptif de l AFC L analyse Factorielle des correspondances...2 1/ Préambule descriptif de l AFC...2 Exemples de types de données que l AFC peut aborder:...2 Quelques types de tableaux traités par l AFC...3 2/ Exercice

Plus en détail

Principaux résultats

Principaux résultats Principaux résultats Le rapport préparé pour la réunion de l OCDE au niveau des ministres de 2001 et intitulé «La nouvelle économie : mythe ou réalité?» concluait que les technologies de l information

Plus en détail

Méthodes de Résolution de problèmes En Intelligence Artificielle

Méthodes de Résolution de problèmes En Intelligence Artificielle Méthodes de Résolution de problèmes En Intelligence Artificielle Résolution de Problèmes et Intelligence Artificielle Résoudre des puzzles Jouer aux échecs Faire des mathématiques Et même conduire une

Plus en détail

Ressources pour le lycée technologique

Ressources pour le lycée technologique éduscol Enseignement de mathématiques Classe de première STMG Ressources pour le lycée technologique Échantillonnage : couleur des yeux au Canada Contexte pédagogique Objectifs Obtenir un intervalle de

Plus en détail

Analyse des Données. Questions de cours. Exercice n o 1. Examen terminal - Durée 3h

Analyse des Données. Questions de cours. Exercice n o 1. Examen terminal - Durée 3h I.U.T de Caen STID 2ème année Département STID Année Universitaire 2002-2003 Responsable de cours : Alain LUCAS Seule la calculatrice type collège est autorisée. Seul le cours est autorisé. On rappelera

Plus en détail

Développement des ressources humaines

Développement des ressources humaines Développement des ressources humaines Comme il a été dit plus haut, la compétitivité d une économie dépend non seulement de son capital matériel mais aussi des connaissances que possèdent ses entrepreneurs

Plus en détail

Contrôle C8 STATISTIQUES DESCRIPTIVES (1h05) Calculatrice autorisée Répondez par des phrases. Relisez-vous! Note attendue :

Contrôle C8 STATISTIQUES DESCRIPTIVES (1h05) Calculatrice autorisée Répondez par des phrases. Relisez-vous! Note attendue : Contrôle C8 STATISTIQUES DESCRIPTIVES (1h05) Calculatrice autorisée Répondez par des phrases. Relisez-vous! Note attendue : Bon courage! Exercice n 1 (.... / 4 points) : Maths et sécurité routière : Analyse

Plus en détail

X. Attribution des places aux élèves par l établissement secondaire

X. Attribution des places aux élèves par l établissement secondaire X. Attribution des places aux élèves par l établissement secondaire 1. Classement des élèves Les élèves seront classés automatiquement grâce au logiciel en ligne dans l ordre décroissant de leur indice

Plus en détail

La Grille, moyen fondamental de l analyse

La Grille, moyen fondamental de l analyse Fiche méthodologie #1 La Grille, moyen fondamental de l analyse Cette rubrique présente des notes et documents publiés par Philippe Latour, enseignant au Master Géomarketing et stratégies territoriales

Plus en détail

Chapitre 4 Solutions des problèmes

Chapitre 4 Solutions des problèmes Chapitre 4 Solutions des problèmes 1. Résolution d'un modèle PLTE à deux variables. (a) La région issible de la relaxation continue ( ) est le polygone ABC représenté à la figure cidessous. La solution

Plus en détail

Problèmes à propos des nombres entiers naturels

Problèmes à propos des nombres entiers naturels Problèmes à propos des nombres entiers naturels 1. On dispose d une grande feuille de papier, on la découpe en 4 morceaux, puis on déchire certains morceaux (au choix) en 4 et ainsi de suite. Peut-on obtenir

Plus en détail

Bibliothèque de Traitement d Images en Niveaux de Gris

Bibliothèque de Traitement d Images en Niveaux de Gris TP Bibliothèque de Traitement d Images en Niveaux de Gris Étudiants : Besnier Alexandre Taforeau Julien Version 1.2 Janvier 2008 2008 Rapport TP - Version 1.2 i Table des matières Introduction 1 1 Objectif

Plus en détail

Vers une meilleure prise en compte de l intermédiation financière en comptabilité nationale

Vers une meilleure prise en compte de l intermédiation financière en comptabilité nationale Vers une meilleure prise en compte de l intermédiation financière en comptabilité nationale La comptabilité nationale recense deux types de production des intermédiaires financiers. La première est directement

Plus en détail

Guide de lecture des fiches de synthèse «LYCEES» pour le suivi des contrats d objectifs 2013-2014

Guide de lecture des fiches de synthèse «LYCEES» pour le suivi des contrats d objectifs 2013-2014 Guide de lecture des fiches de synthèse «LYCEES» pour le suivi des contrats d objectifs 2013-2014 Cette fiche de synthèse fournit un ensemble d indicateurs de contexte et de performance historisés et regroupés

Plus en détail

Exercices supplémentaires

Exercices supplémentaires Exercices supplémentaires Christophe Lalanne Emmanuel Chemla Exercices Exercice 1 Un grand magasin a n portes d entrée ; r personnes arrivent à des instants divers et choisissent au hasard une entrée indépendamment

Plus en détail

Classification. Pr Roch Giorgi. roch.giorgi@univ-amu.fr

Classification. Pr Roch Giorgi. roch.giorgi@univ-amu.fr Classification Pr Roch Giorgi roch.giorgi@univ-amu.fr SESSTIM, Faculté de Médecine, Aix-Marseille Université, Marseille, France http://sesstim-orspaca.org http://optim-sesstim.univ-amu.fr Objectif Rechercher

Plus en détail

Ressources pour le lycée technologique

Ressources pour le lycée technologique éduscol Enseignement de mathématiques Classe de première STMG Ressources pour le lycée technologique Contexte pédagogique Objectifs Suites numériques Visualiser les situations exprimées à l aide de suites

Plus en détail

SEMIN. Analyses factorielles avec R. Elisabeth MORAND INED

SEMIN. Analyses factorielles avec R. Elisabeth MORAND INED SEMIN Analyses factorielles avec R Elisabeth MORAND INED SEMIN R du MNHN 10 Décembre 2009 E. Morand 10 Décembre 2009 INED 1 / 42 Part I Analyse en Composantes Principales : ACP 2 / 42 Sommaire 1 Introduction

Plus en détail

Fiches Outil Acces Sommaire

Fiches Outil Acces Sommaire Fiches Outil Acces Sommaire Fiche Outil Access n 1 :... 2 Le vocabulaire d Access... 2 Fiche Outil Access n 2 :... 4 Créer une table dans la base... 4 Fiche Outil Access n 3 :... 6 Saisir et modifier des

Plus en détail

UNIVERSITE SAAD DAHLAB DE BLIDA

UNIVERSITE SAAD DAHLAB DE BLIDA Chapitre 5 :. Introduction aux méthodes par séparation et évaluation Les méthodes arborescentes ( Branch and Bound Methods ) sont des méthodes exactes d'optimisation qui pratiquent une énumération intelligente

Plus en détail

De 2001 à 2004, les exportations allemandes ont été nettement

De 2001 à 2004, les exportations allemandes ont été nettement Dossiers Anne-Juliette Bessone Benoît Heitz Division synthèse conjoncturelle De 2001 à 2004, les exportations allemandes ont été nettement plus dynamiques que les exportations françaises. Géographiquement,

Plus en détail

de la classification Approche pragmatique t Editions TECHNIP 27 rue Cinoux, 75737 PARIS Cedex 15, FRANCE Arbres hiérarchiques Partitionnements

de la classification Approche pragmatique t Editions TECHNIP 27 rue Cinoux, 75737 PARIS Cedex 15, FRANCE Arbres hiérarchiques Partitionnements Jean-Pierre NAKACHE Ingénieur de recherche CNRS détaché à l'inserm Chargé de cours à l'isup Josiane CONFAIS Ingénieur d'études chargée des enseignements pratiques à l'isup Approche pragmatique de la classification

Plus en détail

Terminologie de la productivité Neuchâtel, septembre 2014

Terminologie de la productivité Neuchâtel, septembre 2014 Département fédéral de l'intérieur DFI Office fédéral de la statistique OFS Économie nationale Terminologie de la productivité Neuchâtel, septembre 2014 Le présent document définit la terminologie en vigueur

Plus en détail

Baccalauréat ES Pondichéry 21 avril 2016

Baccalauréat ES Pondichéry 21 avril 2016 Exercice 1 Commun à tous les candidats Baccalauréat ES Pondichéry 21 avril 216 4 points Cet exercice est un QCM (questionnaire à choix multiples). Pour chacune des quatre questions posées, une seule des

Plus en détail

Exercice 2. Population de Bruxelles de 18 à 65 ans selon le sexe et le statut d occupation - 2010

Exercice 2. Population de Bruxelles de 18 à 65 ans selon le sexe et le statut d occupation - 2010 Chapitre 1. Tableau à double entrée Exercices : solutions Texte provisoire. Merci pour les remarques, commentaires, suggestions Exercice 1 1.a. Population de Bruxelles selon le sexe et la nationalité Hommes

Plus en détail

Niveau. Situations étudiées. Type d activité. Durée. Objectifs

Niveau. Situations étudiées. Type d activité. Durée. Objectifs Fourchettes, non réponses, fausses réponses et redressements... : la cuisine mathématique des sondages Niveau Exercice 1 : 3 ème 2 nde. Exercice 2 : 3 ème 2 nde. Exercice 3 : Seconde ou première. Exercice

Plus en détail

Estimateur d'erreur de ZHU-ZIENKIEWICZ

Estimateur d'erreur de ZHU-ZIENKIEWICZ Titre : Estimateur d'erreur de ZHU-ZIENKIEWICZ Date : 24/04/2012 Page : 1/12 Estimateur d'erreur de ZHU-ZIENKIEWICZ Résumé : On expose dans ce document la méthode d'estimation de l'erreur de discrétisation

Plus en détail

CERI: Centre pour la Recherche et l Innovation dans l Enseignement

CERI: Centre pour la Recherche et l Innovation dans l Enseignement 2 CERI: Centre pour la Recherche et l Innovation dans l Enseignement Qui sommes-nous? Le CERI est reconnu pour être le pionnier de la recherche en éducation, ouvrant de nouveaux domaines d exploration

Plus en détail

Départs en retraite normale, anticipée et différée (French version)

Départs en retraite normale, anticipée et différée (French version) Extrait de : Panorama des pensions 2011 Les systèmes de retraites dans les pays de l'ocde et du G20 Accéder à cette publication : http://dx.doi.org/10.1787/pension_glance-2011-fr Départs en retraite normale,

Plus en détail

1 Droite de régression de y en x

1 Droite de régression de y en x CHU Amiens IFTLM 2ème année, UPJV IUP Santé 2012-2013 Statistique Cours 2 Statistique descriptive à deux variables - Régression Le cours précédent traitait de la statistique descriptive univariée, c est-à-dire

Plus en détail

Texte 1, Choix intertemporel du consommateur Microéconomie 3-851-84

Texte 1, Choix intertemporel du consommateur Microéconomie 3-851-84 1 Texte 1, Choix intertemporel du consommateur Microéconomie 3-851-84 1. Présentation générale du contexte intertemporel La théorie du comportement du consommateur telle que nous l'avons vue jusqu'à présent,

Plus en détail

Initiation aux probabilités.

Initiation aux probabilités. Initiation aux probabilités. On place dans une boite trois boules identiques à l exception de leur couleur : une boule est noire, une est blanche, la troisième est grise. On tire une des boules sans regarder,

Plus en détail

BANQUE CENTRALE EUROPÉENNE

BANQUE CENTRALE EUROPÉENNE Paris, le 10 septembre 2013 BANQUE CENTRALE EUROPÉENNE COMMUNIQUÉ DE PRESSE STATISTIQUES RELATIVES AUX PAIEMENTS POUR 2012 La Banque centrale européenne (BCE) publie aujourd hui les statistiques relatives

Plus en détail

Formation ELAN Fonctions avancées - 1

Formation ELAN Fonctions avancées - 1 Formation ELAN Fonctions avancées - 1 Organisation de la session Ce que je ne vais pas reprendre dans cette formation (sauf si besoin) : Ouverture et présentation générale du logiciel ; Création d'annotations

Plus en détail

Saisir dans EXCEL les résultats du bac comme dans le tableau suivant (cf. figure n 1).

Saisir dans EXCEL les résultats du bac comme dans le tableau suivant (cf. figure n 1). TP n 2 - Calcul du Khi2 Le but de ce TP est de réaliser, à l'aide d'excel, un modèle réutilisable d'analyse bivarié entre des variables qualitatives. Ce modèle permet d aller de la saisie dans un tableau

Plus en détail

COURS DE DATA MINING 6 : MODELISATION NON-SUPERVISEE LES ANALYSES FACTORIELLES

COURS DE DATA MINING 6 : MODELISATION NON-SUPERVISEE LES ANALYSES FACTORIELLES COURS DE DATA MINING 6 : MODELISATION NON-SUPERVISEE LES ANALYSES FACTORIELLES EPF 4/ 5 ème année - Option Ingénierie d Affaires et de Projets - Finance Bertrand LIAUDET 6 : Modélisation non-supervisée

Plus en détail

Eurobaromètre Flash 345 ACCESSIBILITE RÉSUMÉ

Eurobaromètre Flash 345 ACCESSIBILITE RÉSUMÉ Eurobaromètre Flash 345 ACCESSIBILITE RÉSUMÉ Terrain : Mars 2012 Publication : Décembre 2012 Cette étude a été commandée par la Commission européenne, Direction générale de la justice et coordonnée par

Plus en détail

M2 MPRO. Optimisation dans les Graphes 2014-2015

M2 MPRO. Optimisation dans les Graphes 2014-2015 M2 MPRO Optimisation dans les Graphes 2014-2015 Programmation linéaire et problèmes d'optimisation dans les graphes 1 Problèmes d'optimisation dans les graphes : quelles méthodes pour les résoudre? Théorie

Plus en détail

par Jean-François Deslandes

par Jean-François Deslandes GUIDE EXCEL POUR LA STATISTIQUE par Jean-François Deslandes Automne 2000 2 Table des matières RAPPORT DE TABLEAU CROISÉ DYNAMIQUE 4 CONSTRUCTION D'UN TABLEAU DE FRÉQUENCE POUR UNE VARIABLE UNIQUE 4 DISTRIBUTION

Plus en détail

Cours 2 : Rappels de Statistique descriptive. A- Introduction B- Statistique descriptive unidimensionnelle C- Statistique descriptive bidimensionnelle

Cours 2 : Rappels de Statistique descriptive. A- Introduction B- Statistique descriptive unidimensionnelle C- Statistique descriptive bidimensionnelle Cours 2 : Rappels de Statistique descriptive A- Introduction B- Statistique descriptive unidimensionnelle C- Statistique descriptive bidimensionnelle A- Introduction A- Introduction Rappel : Série statistique

Plus en détail

Utiliser un modèle d état prédéfini

Utiliser un modèle d état prédéfini Chapitre 8 Etats rapides Certains boutons sont désactivés, en fonction du type de cellule sélectionné. 4 Répétez les étapes 2 et 3 pour chaque bordure à paramétrer. 5 Cliquez sur le bouton OK pour valider

Plus en détail

Sources et méthodes. Enquête sur l accès au financement des PME employant au moins 10 personnes

Sources et méthodes. Enquête sur l accès au financement des PME employant au moins 10 personnes Sources et méthodes Enquête sur l accès au financement des PME employant au moins 10 personnes L enquête s intéresse aux difficultés rencontrées par les PME employant au moins 10 personnes pour se financer,

Plus en détail

II. LA DIVERSITE DE L'OCCUPATION DU TERRITOIRE

II. LA DIVERSITE DE L'OCCUPATION DU TERRITOIRE II. LA DIVERSITE DE L'OCCUPATION DU TERRITOIRE A. DEMOGRAPHIE 1. Evolution démographique 1.1. Dynamisme démographique 1.2. Structure de la population 1.3. Structure des ménages 2. Hypothèses d'évolution

Plus en détail

Kompass Mode d emploi

Kompass Mode d emploi Service Commun Universitaire d Information et d Orientation (SCUIO) Espace Etudiants Emplois Entreprises RECHERCHER DE L INFORMATION SUR LES ENTREPRISES Kompass Mode d emploi La base de données Kompass

Plus en détail

Document d accompagnement des sujets "zéro"

Document d accompagnement des sujets zéro EVALUATION DES COMPETENCES EXPERIMENTALES I. Présentation d un sujet type Document d accompagnement des sujets "zéro" Ce texte présente la façon dont sont construits les quatre sujets "zéro" pour l évaluation

Plus en détail

Module 3 : Introduction à la Modélisation SOUS MODELER

Module 3 : Introduction à la Modélisation SOUS MODELER Module 3 : Introduction à la Modélisation SOUS MODELER 1 Techniques prédictives Passé pour prédire l avenir 2 Concepts de la modélisation Données test / apprentissage Généralement créées par l utilisateur

Plus en détail

Performance des membres du CAD en matière d'aide

Performance des membres du CAD en matière d'aide Extrait de : Coopération pour le développement : Rapport 2010 Accéder à cette publication : http://dx.doi.org/10.1787/dcr-2010-fr Performance des membres du CAD en matière d'aide Merci de citer ce chapitre

Plus en détail

Pierre-Louis GONZALEZ

Pierre-Louis GONZALEZ SEGMENTATION Pierre-Louis GONZALEZ 1 I. Les méthodes de segmentation. Introduction Les méthodes de segmentation cherchent à résoudre les problèmes de discrimination et de régression en divisant de façon

Plus en détail

EXPÉRIENCE EN CLASSE SUR LE TABLEUR

EXPÉRIENCE EN CLASSE SUR LE TABLEUR EXPÉRIENCE EN CLASSE SUR LE TABLEUR Thème : STATISTIQUES en ème Alain JUILLAC (Collège Condorcet - Puy Guillaume) Véronique JUILLAC (Lycée Montdory - Thiers) Cet article est paru sur le Bulletin Vert de

Plus en détail

T.S.A T E S T S E N I O R A T T I T U D E S. Un test de personnalité spécifiquement conçu pour le recrutement et le bilan professionnel des seniors

T.S.A T E S T S E N I O R A T T I T U D E S. Un test de personnalité spécifiquement conçu pour le recrutement et le bilan professionnel des seniors T.S.A T E S T S E N I O R A T T I T U D E S Un test de personnalité spécifiquement conçu pour le recrutement et le bilan professionnel des seniors Une analyse fonctionnelle de l image de soi et des compétences

Plus en détail

Apprentissage statistique Stratégie du Data-Mining

Apprentissage statistique Stratégie du Data-Mining Apprentissage statistique Stratégie du Data-Mining Hélène Milhem Institut de Mathématiques de Toulouse, INSA Toulouse, France IUP SID, 2011-2012 H. Milhem (IMT, INSA Toulouse) Apprentissage statistique

Plus en détail

Analyse en composantes principales (ACP)

Analyse en composantes principales (ACP) Analyse en composantes principales (ACP) François Husson Laboratoire de mathématiques appliquées - Agrocampus Rennes husson@agrocampus-ouest.fr 1 / 31 Quel type de données? L ACP s intéresse à des tableaux

Plus en détail

OPTIMISATION SOUS CONTRAINTES

OPTIMISATION SOUS CONTRAINTES OPTIMISATION SOUS CONTRAINTES Sommaire 1. Optimisation entre des bornes... 1 2. Exercice... 4 3. Optimisation sous contrainte à variables multiples... 5 Suite à une planification de la production, supposons

Plus en détail

Formation APOGEE Constitution des groupes

Formation APOGEE Constitution des groupes Formation APOGEE Constitution des groupes 1 Présentation générale APOGEE APOGEE : Application pour la gestion des étudiants et des enseignements APOGEE est un logiciel national élaboré par l'amue (Agence

Plus en détail

ACM DE L EXEMPLE «TASTE»

ACM DE L EXEMPLE «TASTE» ACM DE L EXEMPLE «TASTE» AVEC SPAD (VERSION 7.4) BRIGITTE LE ROUX 1 ET PHILIPPE BONNET 2 UNIVERSITE PARIS DESCARTES 1 INTRODUCTION... 2 2 POUR DÉMARRER... 2 2.1 Ouverture du projet archivé TasteMCA_fr...

Plus en détail

Les opérateurs du commerce extérieur Année 2008 Résultats provisoires http://lekiosque.finances.gouv.fr

Les opérateurs du commerce extérieur Année 2008 Résultats provisoires http://lekiosque.finances.gouv.fr Les opérateurs du commerce extérieur Année 2008 Résultats provisoires http://lekiosque.finances.gouv.fr En 2008, la baisse du nombre d exportateurs engagée depuis 2003 s accentue (-3,1 %), quelle que soit

Plus en détail

Couper en deux, encore et encore : la dichotomie

Couper en deux, encore et encore : la dichotomie Couper en deux, encore et encore : la dichotomie I : Jeu du nombre inconnu Un élève volontaire choisit un nombre entier compris entre 0 et 56. Un autre élève cherche à deviner ce nombre, en adoptant la

Plus en détail

Informatique 1ère Année 2012-2013

Informatique 1ère Année 2012-2013 SERIE D EXERCICES N 1 INTRODUCTION, STRUCTURE CONDITIONNELLE : IF..ELSE Exercice 1 Ecrire le programme qui lit deux entiers saisis et affiche leur produit. Modifier ensuite ce programme pour saisir des

Plus en détail

COURS STATISTIQUES. Etude statistique de la couleur des yeux des stars de cinéma américaines. Population : Individu : Variable étudiée :

COURS STATISTIQUES. Etude statistique de la couleur des yeux des stars de cinéma américaines. Population : Individu : Variable étudiée : I) Vocabulaire de la statistique COURS STATISTIQUES Exemple : pour se rendre au collège des Chênes à Chambéry, 46 élèves utilisent un deux roues, 284 élèves utilisent les transports en commun, 163 élèves

Plus en détail

Laboratoire 2 Extraction des caractéristiques

Laboratoire 2 Extraction des caractéristiques Laboratoire 2 Extraction des caractéristiques L objectif de l extraction et de la sélection de caractéristiques est d identifier les caractéristiques importantes pour la discrimination entre classes. Après

Plus en détail

Référentiels partagés. Définition et positionnement dans le SI

Référentiels partagés. Définition et positionnement dans le SI Référence : CNRS / DSI / REFERENTIELS / Référentiels_applications_v5.doc Date : janvier 2005 Version : 5.0 Auteurs : Equipe Référentiels du projet RUE (Référentiels Urbanisation EAI) Passage de la version

Plus en détail

la méthode du direct costing simple

la méthode du direct costing simple la méthode du direct costing simple Encadré par : Mme El Gnaoui Remerciements Ce présent document qui est notre premier mini-projet de comptabilité analytique est d une importance significative d autant

Plus en détail

1. La crise, le risque et les réactions de l épargnant : quelle grille d interprétation?

1. La crise, le risque et les réactions de l épargnant : quelle grille d interprétation? 1. La crise, le risque et les réactions de l épargnant : quelle grille d interprétation? En France, la crise n a fait qu accentuer une tendance récente, suscitée par les débats sur l avenir de l État-providence,

Plus en détail

MATHÉMATIQUES ET SCIENCES HUMAINES

MATHÉMATIQUES ET SCIENCES HUMAINES MATHÉMATIQUES ET SCIENCES HUMAINES M. C. WEISS Variations pédagogiques sur le thème des échantillons systématiques Mathématiques et sciences humaines, tome 102 (1988), p. 39-45.

Plus en détail

L assainissement des finances publiques luxembourgeoises - Alain Steichen - Professeur associé à l Université de Luxembourg

L assainissement des finances publiques luxembourgeoises - Alain Steichen - Professeur associé à l Université de Luxembourg L assainissement des finances publiques luxembourgeoises - Alain Steichen - Professeur associé à l Université de Luxembourg Un cycle de conférences Le «mur» des pensions La réforme fiscale Une vue d ensemble

Plus en détail

LES TYPOLOGIES DE PARCOURS METHODES ET USAGES. Yvette Grelet, Patrick Rousset CEREQ grelet@mrsh.unicaen.fr rousset@cereq.fr

LES TYPOLOGIES DE PARCOURS METHODES ET USAGES. Yvette Grelet, Patrick Rousset CEREQ grelet@mrsh.unicaen.fr rousset@cereq.fr LES TYPOLOGIES DE PARCOURS METHODES ET USAGES Yvette Grelet, Patrick Rousset CEREQ grelet@mrsh.unicaen.fr rousset@cereq.fr 1 PLAN Première partie : un exemple traité «en vraie grandeur» : les 26500 jeunes

Plus en détail

GOUTTE. Analyse Statistique des Données Cours 6. Master 2 EID. LUISS, Libera Università Internazionale degli Studi Sociali

GOUTTE. Analyse Statistique des Données Cours 6. Master 2 EID. LUISS, Libera Università Internazionale degli Studi Sociali LUISS, Libera Università Internazionale degli Studi Sociali Université Paris 13 Laboratoire Analyse, Géométrie et Applications UMR 7539 GOUTTE Analyse Statistique des Données Cours 6 Master 2 EID goutte@math.univ-paris13.fr

Plus en détail

Cours Gestion de patrimoine. Les produits structurés

Cours Gestion de patrimoine. Les produits structurés Cours Gestion de patrimoine Les produits structurés Plan Introduction Importance de la garantie pour les épargnants Utilité des fonds garantis Méthodes de gestion des fonds garantis Méthode du coussin

Plus en détail

ANALYSE FACTORIELLE DES CORRESPONDANCES SIMPLES

ANALYSE FACTORIELLE DES CORRESPONDANCES SIMPLES ANALYSE FACTORIELLE DES CORRESPONDANCES SIMPLES EXEMPLES 1. TYPE D EUDES CSP DES PARENTS 2. A PARTIR DE QUEL AGE? 3. CHOIX D UN NOM DE MARQUE DE CIGARETTES ( D APRES J.P. BENZECRI ) SELECTION DES INDIVIDUS

Plus en détail

CODES CORRECTEURS D'ERREURS

CODES CORRECTEURS D'ERREURS CODES CORRECTEURS D'ERREURS Marc URO TABLE DES MATIÈRES DÉTECTION ET CORRECTION D'ERREURS... 6 CAS D'UN CANAL SANS SYMBOLE D'EFFACEMENT...6 CAS D'UN CANAL AVEC SYMBOLE D'EFFACEMENT...7 GÉNÉRATION ET DÉTECTION

Plus en détail

Le Programme Deb Futurs Leaders 2014

Le Programme Deb Futurs Leaders 2014 Le Programme Deb Futurs Leaders 2014 www.debgroup.com Maintenant que vous avez investi dans votre diplôme, optimisez votre potentiel et investissez avec Deb Group dans votre avenir. En tant qu'innovateurs

Plus en détail

Création, analyse de questionnaires et d'entretiens pour Windows XP, 2003, 2008, 7 et MacOs 10

Création, analyse de questionnaires et d'entretiens pour Windows XP, 2003, 2008, 7 et MacOs 10 Création, analyse de questionnaires et d'entretiens pour Windows XP, 2003, 2008, 7 et MacOs 10 7 Tris à plat Procédures de réalisation des tableaux de fréquence sur les variables logiques : questions à

Plus en détail

Une revue des méthodes de discrimination pour la spectrométrie PIR (centrée sur les méthodes linéaires) JM Roger. jean-michel.roger@cemagref.

Une revue des méthodes de discrimination pour la spectrométrie PIR (centrée sur les méthodes linéaires) JM Roger. jean-michel.roger@cemagref. Une revue des méthodes de discrimination pour la spectrométrie PIR (centrée sur les méthodes linéaires) JM Roger jean-michel.roger@cemagref.fr Plan Qu'est ce que la discrimination? Le modèle de l'analyse

Plus en détail

PRÉPARATION D UNE RANDONNÉE PÉDESTRE

PRÉPARATION D UNE RANDONNÉE PÉDESTRE Check-List du Carnet de Voyages Chris2neuX PRÉPARATION D UNE RANDONNÉE PÉDESTRE I. Appréciation des possibilités humaines II. Etude du terrain III. Etude prévisions météorologiques IV. Etude du terrain

Plus en détail

DATA.DREES MANUEL DÉTAILLÉ DES CUBES DE DONNEES

DATA.DREES MANUEL DÉTAILLÉ DES CUBES DE DONNEES DATA.DREES MANUEL DÉTAILLÉ DES CUBES DE DONNEES LES FONCTIONNALITÉS PROPOSÉES CONSULTER, MANIPULER ET CONSERVER DES CUBES DE DONNÉES EN LIGNE Ce document est destiné à vous présenter le fonctionnement

Plus en détail

POMPE A CHALEUR A MELANGE DE FLUIDES

POMPE A CHALEUR A MELANGE DE FLUIDES POMPE A CHALEUR A MELANGE DE FLUIDES Cette note complète la présentation pédagogique allégée de la pompe à chaleur, en traitant du cas où le fluide thermodynamique est un mélange de vapeurs. C est notamment

Plus en détail

NERIANE GESTION DOCUMENTAIRE

NERIANE GESTION DOCUMENTAIRE NERIANE GESTION DOCUMENTAIRE Le logiciel Nériane Gestion Documentaire est un logiciel offrant différents outils pour gérer des documents. Il est disponible en deux versions différentes : - Une version

Plus en détail

Communication externe. Qui sommes-nous?

Communication externe. Qui sommes-nous? Communication externe Qui sommes-nous? La Banque nationale de Belgique Partout dans le monde, les banques centrales ont pour missions principales de mettre les billets en circulation, de conduire la politique

Plus en détail

Rapport IN52. Sujet : Résolution d un puzzle

Rapport IN52. Sujet : Résolution d un puzzle CARRE Julien PIERNOT Jérôme Rapport IN52 Sujet : Résolution d un puzzle Responsable : M. Ruicheck Y. Automne 2007 1 SOMMAIRE INTRODUCTION...3 I. Description et approche du sujet...4 1. Description 2. Outils

Plus en détail

11) L évaluation des politiques publiques

11) L évaluation des politiques publiques 1 FIPECO, le 14.04.2016 Les fiches de l encyclopédie V) Les dépenses publiques 11) L évaluation des politiques publiques Les objectifs, les techniques et les conditions institutionnelles de réalisation

Plus en détail