Analyse en Composantes Principales (avec SPAD) Classification Ascendante Hiérarchique
|
|
- Marie-Claire Corriveau
- il y a 8 ans
- Total affichages :
Transcription
1 Analyse en Composantes Principales (avec SPAD) et Classification Ascendante Hiérarchique Michel Tenenhaus 1
2 Peinture représentant un étang (Tombeau de Thèbes, 1400 av. J.-C.) extrait de l Histoire de l Art de Ernst Gombrich 2
3 Visualiser
4 2. Les objectifs de l analyse en composantes principales Décrire un tableau individusvariables : - Résumer le tableau à l aide d un petit nombre de facteurs - Visualiser le positionnement des individus les uns par rapport aux autres - Visualiser les corrélations entre les variables - Interpréter les facteurs 4
5 Visualisation des données F 2 (i) i 1 X 1 X p F 1 F 2 0 F 1 (i) i x 1i x pi F 1i F 2i n Le plan factoriel Cor(X j,f 2 ) X j 0 Cor(X j,f 1 ) Tableau Facteurs centrés-réduits éd des données résumant les données p Fh 1 u j hjx j (non corrélés entre eux) La carte des variables 5
6 3. Un exemple de positionnement de produits Caractéristiques de 24 modèles de voiture (Source : L argus de l automobile, 2004) Mdèl Modèle Cylindrée Puissance Vitesse Poids Largeur Longueur (cm 3 ) (ch) (km/h) (kg) (mm) (mm) Citroën C2 1.1 Base Smart Fortwo Coupé Mini Nissan Micra Renault Clio 3.0 V Audi A3 1.9 TDI Peugeot HDI Peugeot V6 BVA Mercedes Classe C 270 CDI BMW 530d Jaguar S-Type27V6Bi-Turbo 2.7 Turbo BMW 745i Mercedes Classe S 400 CDI Citroën C3 Pluriel 1.6i BMWZ425i 2.5i Audi TT 1.8T Aston Martin Vanquish Bentley Continental GT Ferrari Enzo Renault Scenic 1.9 dci Volkswagen Touran 1.9 TDI Land Rover Defender Td Land Rover Discovery Td Nissan X-Trail 2.2 dci
7 Puissance Graphiques en étoile des voitures Longueur Cylindrée Citroën C2 1.1 Smart Fortwo Mini Largeur Vitesse Nissan Micra 1.2 Renault Clio 3.0 V6 Audi A3 1.9 TDI Poids Peugeot HDI 70 Peugeot V6 Mercedes Classe C 270 BMW 530d Jaguar S-Type 2.7 V6 BMW 745i Mercedes Classe S 400 Citroën C3 Pluriel BMW Z4 2.5i Audi TT 1.8T 180 Aston Martin Vanquish Bentley Continental GT Ferrari Enzo Renault Scenic 1.9 dci Volkswagen Touran 1.9 TDI 7 Land Rover Defender Land Rover Discovery Nissan X-Trail 2.2 dci
8 4. Résumé é des données Descriptive Statistics Cylindrée Puissance Vitesse Poids Largeur Longueur N Minimum Maximum Mean Std. Deviation Formule utilisée pour l écart-type : n 1 2 ( i ) 1 i 1 8 s x x n
9 Tableau des corrélations Cylindrée Puissance Vitesse Poids Largeur Longueur Cylindrée Puissance Vitesse Poids Largeur Longueur Toutes les corrélations sont positives. Toutes les corrélations sont significatives au risque 5% ( R 2/ n ) 9
10 5. Le nuage de points associé aux données 1 X 1 X p X p i x 1i x pi x i g n SMART 0 FERRARI X 2 x1... x p g X 1 N={x 1,, x i,, x n } = Nuage de points associé aux données 1 = n Centre de gravité du nuage N : g x i n i1 10
11 6. Inertie totale du nuage de points 1 X 1 X p X p i x 1i x pi x i g n SMART 0 FERRARI X 2 x1... x p g X 1 1 n 2 Inertie totale = I(N, g) = d (x i,g) n i1 1 1 n n p p n p ( xji xj ) ( xji xj ) j i1 j1 j1 n i1 j1 11
12 7. Réduction des données Pour neutraliser le problème des unités on remplace les données d origine par les données centrées-réduites : X X X x X x p p p p de moyenne 0 et d écart-type 1. 12
13 Les données centrées-réduites (SPAD) Total Mean Std. Deviation Case Summaries MODÈLE Zscore: Cylindrée Zscore: Puissance Zscore: Vitesse Zscore: Poids Zscore: Largeur Zscore: Longueur Citroën C2 1.1 Base Smart Fortwo Coupé Mini Nissan Micra Renault Clio 3.0 V Audi A3 1.9 TDI Peugeot HDI Peugeot V6 BVA Mercedes Classe C 270 CDI BMW 530d Jaguar S-Type 2.7 V6 Bi-Turbo BMW 745i Mercedes Classe S 400 CDI Citroën C3 Pluriel 1.6i BMW Z4 2.5i Audi TT 1.8T Aston Martin Vanquish Bentley Continental GT Ferrari Enzo Renault Scenic 1.9 dci Volkswagen Touran 1.9 TDI Land Rover Defender Td Land Rover Discovery Td Nissan X-Trail 2.2 dci Outlier si valeur > 2
14 8. Le nuage de points associé aux données réduites X 1 1 X p X p i x 1i x pi n x pi X i Moyenne X 1 SMART FERRARI X Variance N = {x 1,, x i,, x n } Centre de gravité : g = 0, Inertie totale : I(N, 0) = p 14
15 9. Premier axe principal 1 1 x X i u p 1 0 y i X 2 X 1 Objectif 1 : On cherche l axe 1 passant le mieux possible au milieu du nuage N. On cherche à minimiser l inertie du nuage N par rapport à l axe 1 : I(N 1 n 2, 1 ) d (x i, y i ) n i1 15
16 Premier axe principal 1 1 x X i p 0 y i X 2 X 1 Objectif 2 : On cherche l axe d allongement 1 du nuage N. On cherche à maximiser l inertie du nuage N projeté sur l axe 1 : I( n 2 1 d (y i, 0 ) n i1 1 y,..., y n, 0) 16
17 Les objectifs 1 et 2 sont atteints simultanément X p x i y i 0 1 X 2 X 1 De : on déduit : d 2 (x i,0) d 2 (y i,0) d 2 (x i, y i ) 1 n 1 n n n 2 2 d (xi,0) d (yi,0) i1 n i1 n i1 1 d 2 (x i, y i ) Inertie totale = p = Inertie expliquée par 1 + Inertie résiduelle Maximiser Minimiser 17
18 Résultats t L axe 1 passe par le centre de gravité 0 du nuage de points N. L axe 1 est engendré par le vecteur normé u 1, vecteur propre de la matrice des corrélations R associé à la plus grande valeur propre 1. L inertie expliquée par l axe 1 est égal à 1. La part d inertie expliquée par le premier axe principal 1 est égal à 1 /p. 18
19 Résultat SPAD Tableau des valeurs propres Numéro Valeur Pourcentage Pourcentage propre cumulé
20 Résultat SPAD Les vecteurs propres Libellé de la variable Axe 1 Axe 2 Axe 3 Axe 4 Axe 5 Axe 6 Cylindrée Puissance Vitesse Poids Largeur Longueur Normalisation : = 1 20
21 10. Première composante principale Y 1 X p x i 1 X 1 Smart u 1 0 Y 1 (1) = y i Y 1 (i) X 2 Y 1 est une nouvelle variable définie pour chaque individu i par : Y 1 (i) = longueur algébrique du segment 0y i = coordonnée de y i sur l axe 1 = produit scalaire entre les vecteurs x i et u 1 p = j1 u p 1jx ji Y 1 = j1 u 1 X j j 21
22 Résultats SPAD Carré de la Identificateur Distance à l'origine Axe 1 Axe 2 Axe 3 Axe 4 Axe 5 Axe 6 Citroën C Smart Fortwo Mini Nissan Micra Renault Clio 3.0 V Audi A3 1.9 TDI Peugeot HDI Peugeot V Mercedes Classe C BMW 530d Jaguar S-Type 2.7 V BMW 745i Mercedes Classe S Citroën C3 Pluriel 1.6i BMWZ425i 2.5i Audi TT 1.8T Aston Martin Vanquish Bentley Continental GT Ferrari Enzo Renault Scenic 1.9 dci Volkswagen Touran 1.9 TDI Land Rover Defender Land Rover Discovery Nissan X-Trail 2.2 dci DISTO = d 2 (x i, 0) 22
23 Corrélations entre les variables et les composantes principales Corrélations des variables actives avec les facteurs Libellé de la variable Axe 1 Axe 2 Axe 3 Axe 4 Axe 5 Axe 6 Cylindrée Puissance Vitesse Poids Largeur Longueur Dans SPSS : Component Matrix 23
24 Propriétés de la première composante principale i Y 1 Y 1 = u 11 X 1 + u 12 X u 1p X p Moyenne de Y 1 = 0 Variance de Y 1 = Inertie expliquée par 1 = 1 Cor(X j, Y 1 ) = 1 u 1j 1 p p j1 cor 2 (X j, Y ) 1 p 1 est maximum 24
25 Qualité de la première composante principale Inertie totale = 6 Inertie expliquée par le premier axe principal p = = Part d inertie expliquée par le premier axe principal i : p La première composante principale explique 73,5% de la variance totale. 25
26 11. Deuxième axe principal 2 2 x i Y 2 (i) a i 0 Y 1 (i) 1 26
27 Résultats t On recherche le deuxième axe principal 2 orthogonal à 1 et passant le mieux possible au milieu du nuage. Il passe par le centre de gravité 0 du nuage de points et est engendré par le vecteur normé u 2, vecteur propre de la matrice des corrélations R associé à la deuxième plus grande valeur propre 2. La deuxième composante principale Y 2 est définie par projection des points sur le deuxième axe principal. La deuxième composante principale Y 2 est centrée, de variance 2, et non corrélée à la première composante principale Y 1. 27
28 Exemple Auto 2004 : Le premier plan factoriel 3 Familiales (14,2%) 2 Land Rover Discovery Petites Voitures Nissan X-Trail 2.2 d Jaguar S-Type 2.7 V6 Volkswagen Touran Land Rover Defender Peugeot V6 Mercedes Classe S Renault Scenic 1.9 d Mercedes Classe C BMW 745i Peugeot HDI BMW 530d Bentley Continental Grosses Audi A3 1.9 TDI Citroën C3 Pluriel Voitures Nissan Micra 1.2 Audi TT 1.8T 180 Aston Martin Vanquish (73,5%) Citroën C2 1.1 BMW Z4 2.5i Mini Renault Clio 3.0 V6 Facteu ur 2-2 Smart Fortwo Coupé -3 Le plan explique 87,7% de la variance totale -2 Facteur Sportives 1 Ferrari Enzo
29 La carte des variables 1.0 poids.5 longueur Compon nent 2 [Co or(x j, F 2 )] 0.0 largeur cylindrée -.5 Vitesse Puissance Component 1 [Cor(X 1, F 1 )] Longueur d une flèche = R(X j ; F 1, F 2 ) 29
30 Qualité globale de l analyse Inertie totale = variance totale = p Part de variance expliquée par la première composante principale = Part de variance expliquée par la deuxième composante principale = 1 p 2 Part de variance expliquée par les deux premières composantes principales i = p p 1 2 Et ainsi de suite pour les autres dimensions... 30
31 12. Le biplot Les échelles doivent être identiques sur les deux axes. Le cercle des variables doit être un cercle. 31
32 Interprétation du biplot La répartition des projections des individus i sur l axe variable X j reflète les valeurs x ij Les coordonnées des individus i sont les valeurs des composantes principales : [Y 1 (i), Y 2 (i)]. Les coordonnées des variables X j sont les vecteurs propres multipliés par une certaine constante, par exemple 2 : (2u 1j, 2u 2j ). 32
33 Justification : la formule de reconstitution u 2 Y 2 (i) 0 x i a i Y 1 (i) u 1 De on déduit x i a i = Y 1 (i)u 1 + Y 2 (i)u 2 1 x ij Y 1 1( (i)u 1j + Y 2 (i)u () 2j = Y2 () i u2 Y () 1 i u j, ix, j j = u u Coordonnée de la projection de l individu i sur l axe variable X j j j 2 2 1j 2 j 33
34 Justification de la lecture du bi-plot Axe 2 y 2i i u 2j X j A ij 0 y 1i u 1j Axe 1 0 A i, X / u u ij 2 2 j 1 j 2 j ( yu yu )/ u u x / u u i 1j 2i 2 j 1j 2 j ij 1j 2 j 34
35 13. Exemple des races canines Race Taille Poids Vitesse Intell. Affect. Agress. Fonction 1 Beauceron TA++ PO+ V++ INT+ AF+ AG+ Utilité Basset Berger-Allemand Boxer Bull-Dog TA- TA++ TA+ TA- PO- PO+ PO+ PO- V- V++ V+ V- INT- INT++ INT+ INT+ AF- AF+ AF+ AF+ AG+ AG+ AG+ AG- Chasse Utilité Compagnie Compagnie g Bull-Mastiff Caniche Chihuahua Cocker TA++ TA- TA- TA+ PO++ PO- PO- PO- V- V+ V- V- INT++ INT++ INT- INT+ AF- AF+ AF+ AF+ AG+ AG- AG- AG+ pg Utilité Compagnie Compagnie Compagnie Colley Dalmatien Doberman Dogue Allemand TA++ TA+ TA++ TA++ PO+ PO+ PO+ PO++ V++ V+ V++ V++ INT+ INT+ INT++ INT- AF+ AF+ AF- AF- AG- AG- AG+ AG+ pg Compagnie Compagnie Utilité Utilité Dogue Allemand Epagneul Breton Epagneul Français Fox-Hound Fox-Terrier TA++ TA+ TA++ TA++ TA- PO++ PO+ PO+ PO+ PO- V++ V+ V+ V++ V+ INT INT++ INT+ INT- INT+ AF AF+ AF- AF- AF+ AG+ AG- AG- AG+ AG+ Utilité Chasse Chasse Chasse Compagnie Fox-Terrier Grd Bleu de Gascogne Labrador Lévrier Mastiff TA- TA++ TA+ TA++ TA++ PO- PO+ PO+ PO+ PO++ V+ V+ V+ V++ V INT+ INT- INT+ INT- INT AF+ AF- AF+ AF- AF AG+ AG+ AG- AG- AG+ Compagnie Chasse Chasse Chasse Utilité Mastiff Pékinois Pointer Saint-Bernard Setter TA++ TA- TA++ TA++ TA++ PO++ PO- PO+ PO++ PO+ V- V- V++ V- V++ INT- INT- INT++ INT+ INT+ AF- AF+ AF- AF- AF AG+ AG- AG- AG+ AG Utilité Compagnie Chasse Utilité Chasse Setter Teckel Terre-Neuve TA++ TA- TA++ PO+ PO- PO++ V++ V- V- INT+ INT+ INT+ AF- AF+ AF- AG- AG- AG- Chasse Compagnie Utilité
36 Le tableau disjonctif complet Race T- T+ T++ P- P+ P++ V- V+ V++ I- I+ I++ Af- Af+ Ag- Ag+ Compagnie Chasse Utilité Beauceron Basset Berger all Boxer Bull-dog Bull Mastiff Caniche Chihuahua Cocker Colley Dalmatien Doberman Dogue all Epagneul br Epagneul pg fr Fox-Hound Fox-Terrier Grd Bl de G Labrador Lévrier Mastiff Pékinois Pointer St-Bernard Setter Teckel Terre neuve x ijl = 1 si il individu id i possède la modalité liél de la variable j = 0 sinon 36
37 ACP du tableau disjonctif complet 37
38 Total Mean Std. Deviation 14. Utilisation de SPSS Les données centrées-réduites réduites (SPSS) Case Summaries MODÈLE Zscore: Cylindrée Zscore: Puissance Zscore: Vitesse Zscore: Poids Zscore: Largeur Zscore: Longueur Citroën C2 1.1 Base Smart Fortwo Coupé Mini Nissan Micra Renault Clio 3.0 V Audi A3 1.9 TDI Peugeot HDI Peugeot V6 BVA Mercedes Classe C 270 CDI BMW 530d Jaguar S-Type 2.7 V6 Bi-Turbo BMW 745i Mercedes Classe S 400 CDI Citroën C3 Pluriel 1.6i BMW Z4 2.5i Audi TT 1.8T Aston Martin Vanquish Bentley Continental GT Ferrari Enzo Renault Scenic 1.9 dci Volkswagen Touran 1.9 TDI Land Rover Defender Td Land Rover Discovery Td Nissan X-Trail 2.2 dci Outlier si valeur > 2
39 Résultats SPSS : Les facteurs MODÈLE Facteur 1 Facteur 2 Facteur 3 Facteur 4 Facteur 5 Facteur 6 1 Citroën C2 1.1 Base Smart Fortwo Coupé Mini Nissan Micra Renault Clio 3.0 V Audi A3 1.9 TDI Peugeot HDI Peugeot V6 BVA Mercedes Classe C 270 CDI BMW 530d Jaguar S-Type 2.7 V6 Bi-Turbo BMW 745i Mercedes Classe S 400 CDI Citroën C3 Pluriel 1.6i BMW Z4 2.5i Audi TT 1.8T Aston Martin Vanquish Bentley Continental GT Ferrari Enzo Renault Scenic 1.9 dci Volkswagen Touran 19TDI Land Rover Defender Td Land Rover Discovery Td Nissan X-Trail 2.2 dci Total Mean Std. Deviation
40 Propriétés é des facteurs de SPSS Lien entre les composantes principales et les facteurs de SPSS Les facteurs de SPSS sont les composantes principales p réduites. F h 1 n Y n1 h h Calcul des facteurs de SPSS en fonction des variables (X j ) SPSS p h hj j SPSS j1 F w (X ) w h 1 h u h Cylindrée Puissance Vitesse Poids Largeur Longueur Tableau des w h Component Score Coefficient Matrix Component Extraction Method: Principal Component Analysis. Component Scores. 40
41 15. Construction ti d une typologie des individus id Rechercher des groupes d individus homogènes dans la population : - Deux individus appartenant au même groupe sont proches. - Deux individus appartenant à des groupes différents sont éloignés. Construire une partition de la population en groupes homogènes et différents les uns des autres. On réalise la typologie au choix (1) sur les données centrées-réduites, (2) sur les premières composantes principales (SPAD), (3) sur les premières composantes principales réduites (les facteurs de SPSS). 41
42 Construction ti d une typologie des individus idiid o o o o o o o o o + o o + o o o o o o o o o o Fabrication de groupes à partir de données uniformément réparties Données structurées en trois groupes 42
43 Dendrogramme groups g p Choosing the cutting level l x x x Definition of the clusters 43
44 Dendrogramme indice (1) (3) (4) (2) (5) Individu d origine 44
45 Classification ascendante hiérarchique (Méthode de Ward) X 1 X p g 2 g 1 X 2 g 3 X Distance de Ward : D(G i, G j ) = nn i j 2 d(g,g) i j (n n ) i j n i = effectif de la classe G i 45
46 Tableau des distances entre les voitures Proximity Matrix Case 1:Citroën C2 1.1 Base 2S 2:Smart tfortwo Coupé 3:Mini :Nissan Micra :Land Rover Discovery 24:Nissan X-Trail 2.2 d This is a dissimilarity matrix Squared Euclidean Distance 23:Land 1:Citroën C2 2:Smart 4:Nissan Rover 24:Nissan 1.1 Base Fortwo Coupé 3:Mini Micra Discovery X-Trail 2.2 d p 2 2 k l jk jl j d(x,x) (x x) D (Citroën C2, 1 1 Nissan Micra) = Ward (11)
47 Classification i Ascendante Hiérarchique Étape initiale iti Chaque individu forme une classe. On regroupe les deux individus les plus proches. Étape courante A chaque étape, on regroupe les deux classes G i et G j minimisant le critère de Ward D(G i, G j ). 47
48 H I E R A R C H I C A L C L U S T E R A N A L Y S I S Dendrogram using Ward Method Rescaled Distance Cluster Combine C A S E Label Num Citroën C2 1.1 Base 1 Nissan Micra Peugeot HDI 7 Citroën C3 Pluriel 1 14 BMW Z4 2.5i 15 Audi TT 1.8T Renault Clio 3.0 V6 5 Mini i Volkswagen Touran Nissan X-Trail 2.2 d 24 Audi A3 1.9 TDI 6 Renault Scenic 1.9 d 20 Land Rover Defender 22 Smart Fortwo Coupé 2 Peugeot V6 B BMW 530d 10 Jaguar S-Type 2.7 V6 11 Mercedes Classe C 27 9 BMW 745i 12 Mercedes Classe S Land Rover Discovery Aston Martin Vanquis 17 Bentley Continental 18 Ferrari Enzo 19 48
49 Construction de la classification hiérarchique sur les données centrées-réduites par SPSS Numéro Ainé Benjamin Nb d'éléments terminaux du noeud Distance de Ward Somme des indices de niveau
50 Interprétation de la typologie G45 (14) D(G 2,G 42 ) = Toute la population (G47) D(G 45,G 46 ) = G46 (10) D(G 43,G 44 ) = G2 (1) G42 (13) G43 (7) G44 (3) D(G 23,G 40 ) = D(G 2,G 42 ) = G23 (1) G40 (6) G19 (1) G38 (2) 50
51 Décomposition de la somme des carrés totale X 1 X p g 2 g 1 g g 3 X 2 n K K i k k i k i1 k1 k1 ig k d (x,g) n d (g,g) d (x,g ) Somme des carrés Somme des carrés Somme des carrés 51 totale = (n-1)p = interclasses + intraclasses
52 Coefficient : Somme des carrés intra-classes de la typologie en K classes Distance de Ward(1,4) Stage Agglomeration Schedule Résultats SPSS : Somme des carrés intra-classes Stage Cluster First Qualité de la typologie Cluster Combined Appears Cluster 1 Cluster 2 Coefficients Cluster 1 Cluster 2 Next Stage en K classes : (138 - Coeff[n-K])/ Qualité de la typologie en 2 classes : ( )/138 = Somme des carrés intra-classes pour la typologie en K=2 classes 22 Somme des carrés 23 totale = p(n-1) Groupe contenant 1 52
53 Qualité des typologies Nombre de classes Somme des carrés intraclasses Somme des carrés interclasses % de Somme des carrés expliquée Distance de Ward distance de Ward entre les groupes fusionnés = (S.C. Intra) = (S.C. Inter) 53
54 Qualité de la typologie en K classes La somme des carrés expliquée par la typologie en K classes est égale à la somme des carrés interclasses de la typologie en K classes. La qualité de la typologie est mesurée par la proportion de la somme des carrés totale expliquée par la typologie. 54
55 Choix du nombre de groupes La typologie en 5 groupes explique 81,27 % de la S.C. totale Rescaled Distance Cluster Combine C A S E Label Num Citroën C2 1.1 Base 1 Nissan Micra Peugeot HDI 7 Citroën C3 Pluriel 1 14 BMW Z4 2.5i 15 Audi TT 1.8T Renault Clio 3.0 V6 5 G42 Mini Volkswagen Touran Nissan X-Trail 2.2 d 24 Audi A3 1.9 TDI 6 Renault Scenic 1.9 d 20 Land Rover Defender 22 Smart Fortwo Coupé 2 G2 Peugeot V6 B 8 BMW 530d 10 Jaguar S-Type 2.7 V6 11 Mercedes Classe C 27 9 G43 BMW 745i 12 Mercedes Classe S Land Rover Discovery 23 Aston Martin Vanquis 17 G44 Bentley Continental 18 Ferrari Enzo 19 G19 55
56 Premier plan factoriel et typologie 3 2 Land Rover Discovery Jaguar S-Type 2.7 V6 1 Nissan X-Trail 2.2 d Mercedes Classe S VW Touran Peugeot V6 BMW 745i Land Rover Defender Renault Scenic BMW 530d Mercedes Classe C Peugeot 307 Audi A Citroën C3-1 Nissan Micra Audi TT 1.8T Citroën C2 BMW Z4 2.5i Mini Renault Clio 3.0 V6 Bentley Continental Aston Martin Vanquish Facte eur Smart Fortwo Coupé Ferrari Enzo Facteur 1 56
57 Interprétation des classes Report Ward Method Cylindrée Puissance Vitesse Poids Largeur Longueur 1 Mean N Mean N Mean N Mean N Mean N Total Mean N
58 16. C.A.H. des variables Les données de Kendall 48 candidats à un certain poste sont évalués sur 15 variables : (1) Form of letter of application i (9) Experience (2) Appearance (10) Drive (3) Academic ability (11) Ambition (4) Likeability (12) Grasp (5) Self-confidence (13) Potential (6) Lucidity (14) Keeness to join (7) Honesty (15) Suitability (8) Salesmanship 58
59 1 2 3 Case Summaries X1 X2 X3 X4 X5 X6 X7 X8 X9 X10 X11 X12 X13 X14 X
60 Tableau des corrélations Correlation Matrix Correlation X1 X2 X3 X4 X5 X6 X7 X8 X9 X10 X11 X12 X13 X14 X15 X X X X X X X X X X X X X X X One of the questions of interest here is how the variables cluster, in the sense that some of the qualities may be correlated or confused in the judge s mind. (There was no purpose in clustering the candidates - only one was to be chosen). 60
61 Classification Ascendante Hiérarchique des variables Méthode des plus proches voisins A chaque étape, on fusionne les deux groupes G i et G j maximisant : Max Cor( X, X ) X G, X G a i b j On fusionne G2 et G3. a b G1 o o o o o G G3 61
62 Classification Ascendante Hiérarchique des variables H I E R A R C H I C A L C L U S T E R A N A L Y S I S Dendrogram using Single Linkage (VOISINS LES PLUS PROCHES) Rescaled Distance Cluster Combine C A S E Label Num X6 6 X12 12 X13 13 X8 8 X11 11 X5 5 X10 10 X9 9 X15 15 X4 4 X14 14 X7 7 X1 1 X2 2 X3 3 62
63 Classification Ascendante Hiérarchique des variables Méthode des voisins les plus éloignés A chaque étape, on fusionne les deux groupes G i et G j maximisant : Min Cor( X, X ) X G, X G a i b j On fusionne G1 et G2. a b G1 o o o o o G G3 63
64 Classification Ascendante Hiérarchique des variables H I E R A R C H I C A L C L U S T E R A N A L Y S I S Dendrogram using Complete Linkage (VOISINS LES PLUS ELOIGNES) Rescaled Distance Cluster Combine C A S E Label Num X6 6 X12 12 X8 8 X11 11 X5 5 X10 10 X13 13 X2 2 X4 4 X14 14 X7 7 X9 9 X15 15 X1 1 X3 3 64
65 Bloc 1 Correlation Matrix Correlation X2 X5 X6 X8 X10 X11 X12 X13 X X X X X X X X Les corrélations sont toutes positives. 65
66 Bloc 2 Correlation Matrix X4 X7 X14 Correlation X4 X7 X Bloc 3 Correlation Matrix X1 X9 X15 Correlation X1 X9 X
67 Interprétation des blocs Bloc 1 : Qualités humaines favorables au poste Appearance, Self-confidence, Lucidity, Salesmanship, Drive, Ambition, Grasp, Potential Bloc 2 : Qualités de franchise et de communication Likeability, Honesty, Keenness to join Bloc 3 : Expérience Form of letter of application, Experience, Suitability Bloc 4 : Diplôme Academic ability 67
La classification automatique de données quantitatives
La classification automatique de données quantitatives 1 Introduction Parmi les méthodes de statistique exploratoire multidimensionnelle, dont l objectif est d extraire d une masse de données des informations
Plus en détailACP Voitures 1- Méthode
acp=princomp(voit,cor=t) ACP Voitures 1- Méthode Call: princomp(x = voit, cor = T) Standard deviations: Comp.1 Comp.2 Comp.3 Comp.4 Comp.5 Comp.6 2.1577815 0.9566721 0.4903373 0.3204833 0.2542759 0.1447788
Plus en détailESIEA PARIS 2010-2011
ESIEA PARIS 00-0 Exame MAT 50 DATA MINING Vedredi 6 Novembre 00 Première Partie : 5 miutes Eseigat resposable : Frédéric Bertrad Remarque importat : les questios de ce questioaire sot posées das le cotexte
Plus en détailL ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ
L ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ INTRODUCTION Données : n individus observés sur p variables quantitatives. L A.C.P. permet d eplorer les liaisons entre variables et
Plus en détailAnalyse en Composantes Principales
Analyse en Composantes Principales Anne B Dufour Octobre 2013 Anne B Dufour () Analyse en Composantes Principales Octobre 2013 1 / 36 Introduction Introduction Soit X un tableau contenant p variables mesurées
Plus en détail01-2014 Brochure ALD ELECTRIC PART OF ALD NEWMOBILITY
01-2014 Brochure ALD ELECTRIC PART OF ALD NEWMOBILITY 1 Brochure ALD electric INTRODUCTION Notre offre ALD electric se compose d une gamme très complète de véhicules électriques comprenant des hybrides
Plus en détailStéphane Tufféry DATA MINING & STATISTIQUE DÉCISIONNELLE. 04/04/2008 Stéphane Tufféry - Data Mining - http://data.mining.free.fr
Stéphane Tufféry DATA MINING & STATISTIQUE DÉCISIONNELLE 1 Plan du cours Qu est-ce que le data mining? A quoi sert le data mining? Les 2 grandes familles de techniques Le déroulement d un projet de data
Plus en détailObjectifs. Clustering. Principe. Applications. Applications. Cartes de crédits. Remarques. Biologie, Génomique
Objectifs Clustering On ne sait pas ce qu on veut trouver : on laisse l algorithme nous proposer un modèle. On pense qu il existe des similarités entre les exemples. Qui se ressemble s assemble p. /55
Plus en détailATELIER SOLUTION. Acheter ou louer? Réforme 2006 de la fiscalité applicable aux véhicules. Avec la collaboration de P.1
ATELIER SOLUTION Acheter ou louer? Réforme 2006 de la fiscalité applicable aux véhicules Avec la collaboration de P.1 Le marché du véhicule d entreprise P.2 La proportion d'entreprises qui financent au
Plus en détailMarché de l'automobile - Automobile - Type de carrosserie - Modèle d'automobile
Le marché automobile est fréquemment analysé sous forme de segments ou catégories de voitures, qui indiquent le positionnement de chaque modèle sur le marché. Catégories : Marché de l'automobile - Automobile
Plus en détailL'analyse des données à l usage des non mathématiciens
Montpellier L'analyse des données à l usage des non mathématiciens 2 ème Partie: L'analyse en composantes principales AGRO.M - INRA - Formation Permanente Janvier 2006 André Bouchier Analyses multivariés.
Plus en détailIntroduction à l approche bootstrap
Introduction à l approche bootstrap Irène Buvat U494 INSERM buvat@imedjussieufr 25 septembre 2000 Introduction à l approche bootstrap - Irène Buvat - 21/9/00-1 Plan du cours Qu est-ce que le bootstrap?
Plus en détailPLAN. Ricco Rakotomalala Tutoriels Tanagra - http://tutoriels-data-mining.blogspot.fr/ 2
Apprentissage non-supervisé ou apprentissage multi-supervisé? Ricco RAKOTOMALALA Tutoriels Tanagra - http://tutoriels-data-mining.blogspot.fr/ PLAN. Classification automatique, typologie, etc.. Interprétation
Plus en détail2 nd semestre. Synthèse de l étude D3 Parcours Analyse de la fidélité des clients par marque. En partenariat avec
2 nd semestre 2014 Synthèse de l étude D3 Parcours Analyse de la fidélité des clients par marque En partenariat avec Note de synthèse 1 +33 6 87 70 31 12 1. Cadre général L étude D3 Parcours est réalisée
Plus en détailINTRODUCTION À L ANALYSE FACTORIELLE DES CORRESPONDANCES
INTRODUCTION À L ANALYSE FACTORIELLE DES CORRESPONDANCES Dominique LAFFLY Maître de Conférences, Université de Pau Laboratoire Société Environnement Territoire UMR 5603 du CNRS et Université de Pau Domaine
Plus en détail1 Complément sur la projection du nuage des individus
TP 0 : Analyse en composantes principales (II) Le but de ce TP est d approfondir nos connaissances concernant l analyse en composantes principales (ACP). Pour cela, on reprend les notations du précédent
Plus en détailLa segmentation à l aide de EG-SAS. A.Bouhia Analyste principal à la Banque Nationale du Canada. Chargé de cours à l UQAM
La segmentation à l aide de EG-SAS A.Bouhia Analyste principal à la Banque Nationale du Canada. Chargé de cours à l UQAM Définition de la segmentation - Au lieu de considérer une population dans son ensemble,
Plus en détailEnjeux mathématiques et Statistiques du Big Data
Enjeux mathématiques et Statistiques du Big Data Mathilde Mougeot LPMA/Université Paris Diderot, mathilde.mougeot@univ-paris-diderot.fr Mathématique en Mouvements, Paris, IHP, 6 Juin 2015 M. Mougeot (Paris
Plus en détailVotation populaire du 23 septembre 2012 sur l'imposition des véhicules routiers
1 Conférence de presse de la Direction de la police et des affaires militaires du 04.09.2012 Votation populaire du 23 septembre 2012 sur l'imposition des véhicules routiers Conférence de Hansulrich Kuhn,
Plus en détailClassification non supervisée
AgroParisTech Classification non supervisée E. Lebarbier, T. Mary-Huard Table des matières 1 Introduction 4 2 Méthodes de partitionnement 5 2.1 Mesures de similarité et de dissimilarité, distances.................
Plus en détail5KNA Productions 2013
Une Histoire de l Automobile 5KNA Productions 2013 1769 Le Fardier de Cugnot Chariot propulsé par une chaudière à vapeur. Vitesse: 4 km/h. Autonomie: 15 minutes 1770 Le premier accident Le Fardier, sans
Plus en détailLA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING»
LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING» Gilbert Saporta Professeur de Statistique Appliquée Conservatoire National des Arts et Métiers Dans leur quasi totalité, les banques et organismes financiers
Plus en détailLa Nissan Leaf 2.0 est élue Grand Prix Auto Environnement
INFORMATION PRESSE Le 22 mai 2013 PRIX AUTO ENVIRONNEMENT MAAF 2013 La Nissan Leaf 2.0 est élue Grand Prix Auto Environnement MAAF Assurances récompense 5 véhicules pour la nouvelle édition du Prix Auto
Plus en détail"Étude TOPÉO" Le Concept de la voiture low cost en France => Cas concret : la NANO de TATA
"Étude TOPÉO" Le Concept de la voiture low cost en France => Cas concret : la NANO de TATA Étude en Ligne, réalisée par CEGMA TOPO, du 0 au 06 avril 009 Auprès de 360 individus : titulaires du permis de
Plus en détailAnalyse de la variance Comparaison de plusieurs moyennes
Analyse de la variance Comparaison de plusieurs moyennes Biostatistique Pr. Nicolas MEYER Laboratoire de Biostatistique et Informatique Médicale Fac. de Médecine de Strasbourg Mars 2011 Plan 1 Introduction
Plus en détailREVUE DE STATISTIQUE APPLIQUÉE
REVUE DE STATISTIQUE APPLIQUÉE H. ABDALLAH G. SAPORTA Mesures de distance entre modalités de variables qualitatives; application à la classification Revue de statistique appliquée, tome 51, n o 2 (2003),
Plus en détailIntroduction. Préambule. Le contexte
Préambule... INTRODUCTION... BREF HISTORIQUE DE L ACP... 4 DOMAINE D'APPLICATION... 5 INTERPRETATIONS GEOMETRIQUES... 6 a - Pour les n individus... 6 b - Pour les p variables... 7 c - Notion d éléments
Plus en détailDéroulement d un projet en DATA MINING, préparation et analyse des données. Walid AYADI
1 Déroulement d un projet en DATA MINING, préparation et analyse des données Walid AYADI 2 Les étapes d un projet Choix du sujet - Définition des objectifs Inventaire des données existantes Collecte, nettoyage
Plus en détailAkka Technologies au service de la voiture électrique - Cartech.fr
1 sur 5 30/08/2010 12:40 508 peugeot Accueil News & blogs Produits Shopping Telecharger forum Cartech Inscription CNET France Forums Infotrafic Environnement Technologies embarquées Concept-car Accessoires
Plus en détailISFA 2 année 2002-2003. Les questions sont en grande partie indépendantes. Merci d utiliser l espace imparti pour vos réponses.
On considère la matrice de données : ISFA 2 année 22-23 Les questions sont en grande partie indépendantes Merci d utiliser l espace imparti pour vos réponses > ele JCVGE FM1 GM JCRB FM2 JMLP Paris 61 29
Plus en détailSéance 11 : Typologies
Séance 11 : Typologies Sommaire Proc CLUSTER : Typologie hiérarchique... 3 Proc FASTCLUS : Typologie nodale... 8 Proc MODECLUS : Typologie non paramétrique... 11 - Les phénomènes observés (attitudes, comportements,
Plus en détailLe baromètre BforBank - Vague 5 - Présentation globale des résultats Thème abordé : L automobile
Le baromètre BforBank - Vague 5 - Présentation globale des résultats Thème abordé : L automobile Présentation du 22 juin 2011 N Projet : BJ7418 A : BforBank & L Express De : OpinionWay OpinionWay, 06/07/2011
Plus en détailFinanzführerschäin. Maison des jeunes Am Quartier
Finanzführerschäin Maison des jeunes Am Quartier 17 mars 2015 Table des matières 1. Qu est-ce qu une transaction? Les notions de «bien» et «service»... 3 2. Qu est-ce qu une dépense? Les notions de besoins
Plus en détailRésumé de l étude réalisée par CO 2 logic pour le compte de la STIB
Comparaison des émissions de CO 2 par mode de transport en Région de Bruxelles-Capitale Résumé de l étude réalisée par CO 2 logic pour le compte de la STIB 100% Papier recyclé Janvier 2008 Résumé Déplacer
Plus en détailLOW COST TOUT INCLUS FIAT PANDA. Moteur: Essence A/C Radio CD Assurance tous risques sans franchise Réservoir plein PRIX / SEMAINE
LOW COST TOUT INCLUS FIAT PANDA Assurance tous risques sans franchise Réservoir plein 01.01.15-30.06.15 20.09.15 30.06.15 01.07.15-31.07.15 01.08.15-23.08.15 23.08.15-20.09.15 190 240 315 240 LOW COST
Plus en détailCOURS DE DATA MINING 4 : MODELISATION NON-SUPERVISEE CLASSIFICATIONS AUTOMATIQUES
COURS DE DATA MINING 4 : MODELISATION NON-SUPERVISEE CLASSIFICATIONS AUTOMATIQUES EPF 4/ 5 ème année - Option Ingénierie d Affaires et de Projets - Finance Bertrand LIAUDET 4 : Modélisation non-supervisée
Plus en détailStatistique : Résumé de cours et méthodes
Statistique : Résumé de cours et méthodes 1 Vocabulaire : Population : c est l ensemble étudié. Individu : c est un élément de la population. Effectif total : c est le nombre total d individus. Caractère
Plus en détailMAP 553 Apprentissage statistique
MAP 553 Apprentissage statistique Université Paris Sud et Ecole Polytechnique http://www.cmap.polytechnique.fr/~giraud/map553/map553.html PC1 1/39 Apprentissage? 2/39 Apprentissage? L apprentissage au
Plus en détailVéhicules électriques
Véhicules électriques Marc Béranger Véhicules électriques Marc Béranger 15 juin 2012 1 Plan de la présentation Histoire de l automobile Puissance et énergie Stockage d énergie Moteur électrique Vehicle-to-grid
Plus en détailExtraction d informations stratégiques par Analyse en Composantes Principales
Extraction d informations stratégiques par Analyse en Composantes Principales Bernard DOUSSET IRIT/ SIG, Université Paul Sabatier, 118 route de Narbonne, 31062 Toulouse cedex 04 dousset@irit.fr 1 Introduction
Plus en détailBig Data et Graphes : Quelques pistes de recherche
Big Data et Graphes : Quelques pistes de recherche Hamamache Kheddouci Laboratoire d'informatique en Image et Systèmes d'information LIRIS UMR 5205 CNRS/INSA de Lyon/Université Claude Bernard Lyon 1/Université
Plus en détailAnalyses multivariées avec R Commander (via le package FactoMineR) Qu est ce que R? Introduction à R Qu est ce que R?
Analyses multivariées avec R Commander Analyses multivariées avec R Commander (via le package FactoMineR) Plate-forme de Support en Méthodologie et Calcul Statistique (SMCS) - UCL 1 Introduction à R 2
Plus en détailÉvaluation de la régression bornée
Thierry Foucart UMR 6086, Université de Poitiers, S P 2 M I, bd 3 téléport 2 BP 179, 86960 Futuroscope, Cedex FRANCE Résumé. le modèle linéaire est très fréquemment utilisé en statistique et particulièrement
Plus en détailAnalyse de la vidéo. Chapitre 4.1 - La modélisation pour le suivi d objet. 10 mars 2015. Chapitre 4.1 - La modélisation d objet 1 / 57
Analyse de la vidéo Chapitre 4.1 - La modélisation pour le suivi d objet 10 mars 2015 Chapitre 4.1 - La modélisation d objet 1 / 57 La représentation d objets Plan de la présentation 1 La représentation
Plus en détailPRIX AUTO ENVIRONNEMENT MAAF 2014
INFORMATION PRESSE Le 4 juin 2014 PRIX AUTO ENVIRONNEMENT MAAF 2014 La PEUGEOT 308 1,2L PURETECH STOP&START élue Grand Prix Auto Environnement Attribution d un Prix Spécial 10 ans pour Toyota pour sa gamme
Plus en détailChapitre 2 : Caractéristiques du mouvement d un solide
Chapitre 2 : Caractéristiques du mouvement d un solide I Rappels : Référentiel : Le mouvement d un corps est décris par rapport à un corps de référence et dépend du choix de ce corps. Ce corps de référence
Plus en détailLogiciel XLSTAT version 7.0. 40 rue Damrémont 75018 PARIS
Logiciel XLSTAT version 7.0 Contact : Addinsoft 40 rue Damrémont 75018 PARIS 2005-2006 Plan Présentation générale du logiciel Statistiques descriptives Histogramme Discrétisation Tableau de contingence
Plus en détailStatistique Descriptive Multidimensionnelle. (pour les nuls)
Publications de l Institut de Mathématiques de Toulouse Statistique Descriptive Multidimensionnelle (pour les nuls) (version de mai 2010) Alain Baccini Institut de Mathématiques de Toulouse UMR CNRS 5219
Plus en détailLe No.1 de l économie d énergie pour patinoires.
Le No.1 de l économie d énergie pour patinoires. Partner of REALice system Economie d énergie et une meilleure qualité de glace La 2ème génération améliorée du système REALice bien connu, est livré en
Plus en détailCollège Avril 2015. Mise en service de l infrastructure de recharge de véhicules électriques sur le département des Hautes-Alpes
Collège Avril 2015 Mise en service de l infrastructure de recharge de véhicules électriques sur le département des Hautes-Alpes Contexte et enjeux Les enjeux du véhicule électrique sont multiples : Réduire
Plus en détailScénario: Données bancaires et segmentation de clientèle
Résumé Scénario: Données bancaires et segmentation de clientèle Exploration de données bancaires par des méthodes uni, bi et multidimensionnelles : ACP, AFCM k-means, CAH. 1 Présentation Le travail proposé
Plus en détailTUBES ET ACCESSOIRES Serrurier A ailettes Construction Canalisation Spéciaux
TUBES ET ACCESSOIRES 47 Serrurier A ailettes Construction Canalisation Spéciaux Possibilité d autres sections sur demande. Les caractéristiques indiquées sont théoriques et non garanties. TUBES 48 TUBES
Plus en détailUne comparaison de méthodes de discrimination des masses de véhicules automobiles
p.1/34 Une comparaison de méthodes de discrimination des masses de véhicules automobiles A. Rakotomamonjy, R. Le Riche et D. Gualandris INSA de Rouen / CNRS 1884 et SMS / PSA Enquêtes en clientèle dans
Plus en détailINF6304 Interfaces Intelligentes
INF6304 Interfaces Intelligentes filtres collaboratifs 1/42 INF6304 Interfaces Intelligentes Systèmes de recommandations, Approches filtres collaboratifs Michel C. Desmarais Génie informatique et génie
Plus en détailINNOVATION. HAUTE PERFORMANCE. SÉCURITÉ. HIER. AUJOURD HUI. DEMAIN. www.textar.com
INNOVATION. HAUTE PERFORMANCE. SÉCURITÉ. HIER. AUJOURD HUI. DEMAIN. www.textar.com TOUT. SAUF DES COMPROMIS. Quand il s agit de technologie de freinage Premium, vous pouvez compter sur Textar. Nous n acceptons
Plus en détailLe Data Mining au service du Scoring ou notation statistique des emprunteurs!
France Le Data Mining au service du Scoring ou notation statistique des emprunteurs! Comme le rappelle la CNIL dans sa délibération n 88-083 du 5 Juillet 1988 portant adoption d une recommandation relative
Plus en détailThéorie des sondages : cours 5
Théorie des sondages : cours 5 Camelia Goga IMB, Université de Bourgogne e-mail : camelia.goga@u-bourgogne.fr Master Besançon-2010 Chapitre 5 : Techniques de redressement 1. poststratification 2. l estimateur
Plus en détail1 - PRESENTATION GENERALE...
Contenu PREAMBULE... 2 INTRODUCTION... 2 1 - PRESENTATION GENERALE... 4 Qualité et optimalité... 8 2 - AGREGATION AUTOUR DE CENTRES MOBILES... 9 2.1 LES BASES DE L'ALGORITHME... 10 2.2 TECHNIQUES CONNEXES...
Plus en détailInitiation à l analyse en composantes principales
Fiche TD avec le logiciel : tdr601 Initiation à l analyse en composantes principales A.B. Dufour & J.R. Lobry Une première approche très intuitive et interactive de l ACP. Centrage et réduction des données.
Plus en détailAnalyse des correspondances avec colonne de référence
ADE-4 Analyse des correspondances avec colonne de référence Résumé Quand une table de contingence contient une colonne de poids très élevé, cette colonne peut servir de point de référence. La distribution
Plus en détailRicco.Rakotomalala http://eric.univ-lyon2.fr/~ricco/cours
Ricco.Rakotomalala http://eric.univ-lyon2.fr/~ricco/cours Références : 1. G. Saporta, «Probabilités, Analyse de données et Statistique», Dunod, 2006 ; partie théorique, pages 155 à 177 ; partie pratique,
Plus en détailHuiles moteurs pour véhicules légers
Contact: Huiles moteurs pour véhicules légers FUCHS LUBRIFIANT FRANCE DIVISION AUTO MOTO 81, RUE DE L'INDUSTRIE 92500 RUEIL-MALMAISON TEL. : 01.41.37.42.00 FAX : 01.41.37.42.01 www.fuchs-oil.fr Des huiles
Plus en détailModule Title: French 4
CORK INSTITUTE OF TECHNOLOGY INSTITIÚID TEICNEOLAÍOCHTA CHORCAÍ Semester 2 Examinations 2010 Module Title: French 4 Module Code: LANG 6020 School: Business Programme Title: Bachelor of Business Stage 2
Plus en détaildonnées en connaissance et en actions?
1 Partie 2 : Présentation de la plateforme SPSS Modeler : Comment transformer vos données en connaissance et en actions? SPSS Modeler : l atelier de data mining Large gamme de techniques d analyse (algorithmes)
Plus en détailConsommation de flotte (1989 2012)
Bases et méthodologie de comparaison L Association des importateurs suisses d automobiles «auto-suisse» établit chaque année la consommation moyenne des voitures de tourisme vendues appelée consommation
Plus en détailDATA MINING - Analyses de données symboliques sur les restaurants
Master 2 Professionnel - Informatique Décisionnelle DATA MINING - Analyses de données symboliques sur les restaurants Etudiants : Enseignant : Vincent RICHARD Edwin DIDAY Seghir SADAOUI SOMMAIRE I Introduction...
Plus en détailAdaptez-vous aux nouvelles tendances de la distribution automobile
Adaptez-vous aux nouvelles tendances de la distribution automobile Les nouvelles tendances de la distribution automobile Le comportement du client Le client est exigeant Le client a conscience de sa valeur
Plus en détailProgrammation linéaire
Programmation linéaire DIDIER MAQUIN Ecole Nationale Supérieure d Electricité et de Mécanique Institut National Polytechnique de Lorraine Mathématiques discrètes cours de 2ème année Programmation linéaire
Plus en détailEtude d un cas industriel : Optimisation de la modélisation de paramètre de production
Revue des Sciences et de la Technologie RST- Volume 4 N 1 /janvier 2013 Etude d un cas industriel : Optimisation de la modélisation de paramètre de production A.F. Bernate Lara 1, F. Entzmann 2, F. Yalaoui
Plus en détailLa boucle for La boucle while L utilisation du if else. while (condition) { instruction(s) }
VI Initiation à la programmation sous Comme nous l avons constaté tout au long du document, offre de nombreuses fonctionnalités En tant que nouvelles utilisateurs de il vous est désormais PRESQUE possible
Plus en détailHistorique. Architecture. Contribution. Conclusion. Définitions et buts La veille stratégique Le multidimensionnel Les classifications
L intelligence économique outil stratégique pour l entreprise Professeur Bernard DOUSSET dousset@irit.fr http://atlas.irit.fr Institut de Recherche en Informatique de Toulouse (IRIT) Equipe Systèmes d
Plus en détailCONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures)
CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE Cinquième épreuve d admissibilité STATISTIQUE (durée : cinq heures) Une composition portant sur la statistique. SUJET Cette épreuve est composée d un
Plus en détailFORMULAIRE DE STATISTIQUES
FORMULAIRE DE STATISTIQUES I. STATISTIQUES DESCRIPTIVES Moyenne arithmétique Remarque: population: m xμ; échantillon: Mx 1 Somme des carrés des écarts "# FR MOYENNE(série) MOYENNE(série) NL GEMIDDELDE(série)
Plus en détailREMBOURSÉS* REMBOURSÉS * SUR VOS PNEUS TTC TTC. Mer : 24 Température : 30 Remise : 80 E. Jusqu à. Jusqu à
Mer : 24 Température : 30 Remise : 80 E 80 e Du 21 juin au 24 juillet 2010 REMBOURSÉS* REMBOURSÉS * SUR VOS PNEUS POUR L ACHAT ET LA POSE DE 4 PNEUS TOURISME OU 4X4 ÉTÉ *Voir conditions en page 3. Et en
Plus en détailUne nouvelle approche de détection de communautés dans les réseaux sociaux
UNIVERSITÉ DU QUÉBEC EN OUTAOUAIS Département d informatique et d ingénierie Une nouvelle approche de détection de communautés dans les réseaux sociaux Mémoire (INF 6021) pour l obtention du grade de Maîtrise
Plus en détailIndividus et informations supplémentaires
ADE-4 Individus et informations supplémentaires Résumé La fiche décrit l usage des individus supplémentaires dans des circonstances variées. En particulier, cette pratique est étendue aux analyses inter
Plus en détailVISUALISATION DES DISTANCES ENTRE LES CLASSES DE LA CARTE DE KOHONEN POUR LE DEVELOPPEMENT D'UN OUTIL D'ANALYSE ET DE REPRESENTATION DES DONNEES
VISUALISATION DES DISTANCES ENTRE LES CLASSES DE LA CARTE DE KOHONEN POUR LE DEVELOPPEMENT D'UN OUTIL D'ANALYSE ET DE REPRESENTATION DES DONNEES Patrick Rousset 1,2 et Christiane Guinot 3 1 CEREQ, Service
Plus en détailLA PUISSANCE DES MOTEURS. Avez-vous déjà feuilleté le catalogue d un grand constructeur automobile?
LA PUISSANCE DES MOTEURS Avez-vous déjà feuilleté le catalogue d un grand constructeur automobile? Chaque modèle y est décliné en plusieurs versions, les différences portant essentiellement sur la puissance
Plus en détailSTATISTIQUES. UE Modélisation pour la biologie
STATISTIQUES UE Modélisation pour la biologie 2011 Cadre Général n individus: 1, 2,..., n Y variable à expliquer : Y = (y 1, y 2,..., y n ), y i R Modèle: Y = Xθ + ε X matrice du plan d expériences θ paramètres
Plus en détailCours de méthodes de scoring
UNIVERSITE DE CARTHAGE ECOLE SUPERIEURE DE STATISTIQUE ET D ANALYSE DE L INFORMATION Cours de méthodes de scoring Préparé par Hassen MATHLOUTHI Année universitaire 2013-2014 Cours de méthodes de scoring-
Plus en détailWWW.ATD-FRANCE.COM BOÎTES DE VITESSES MANUELLES AUTOMATIQUES FRANCE 05 57 68 17 68 PARIS 0 820 250 200
WWW.ATD-FRANCE.COM 2013 BOÎTES DE VITESSES MANUELLES AUTOMATIQUES FRANCE 05 57 68 17 68 PARIS 0 820 250 200 1 CHOISIR LE LEADER DU RECONDITIONNEMENT DE BOÎTES DE VITESSES EN FRANCE C'EST S'ASSURER : LA
Plus en détailDimensionnement d une roue autonome pour une implantation sur un fauteuil roulant
Dimensionnement d une roue autonome pour une implantation sur un fauteuil roulant I Présentation I.1 La roue autonome Ez-Wheel SAS est une entreprise française de technologie innovante fondée en 2009.
Plus en détailL'analyse de données. Polycopié de cours ENSIETA - Réf. : 1463. Arnaud MARTIN
L'analyse de données Polycopié de cours ENSIETA - Réf : 1463 Arnaud MARTIN Septembre 2004 Table des matières 1 Introduction 1 11 Domaines d'application 2 12 Les données 2 13 Les objectifs 3 14 Les méthodes
Plus en détailCaroline Hurault-Delarue 1, Cécile Chouquet 2, Nicolas Savy 2, Isabelle Lacroix 1, Christine Damase- Michel 1
Trajectoires individuelles d'exposition aux psychotropes au cours de la grossesse et partitionnement en fonction du profil d'exposition : utilisation des K-means pour données longitudinales Caroline Hurault-Delarue
Plus en détailHonda se place en tête de la satisfaction des propriétaires français de nouveaux véhicules pour la troisième année consécutive
Etude de J.D. Power and Associates en partenariat avec L Automobile Magazine : La satisfaction des propriétaires de véhicules en France diminue considérablement par rapport à 2010 Honda se place en tête
Plus en détailBig Data et Graphes : Quelques pistes de recherche
Big Data et Graphes : Quelques pistes de recherche Hamamache Kheddouci http://liris.cnrs.fr/hamamache.kheddouci Laboratoire d'informatique en Image et Systèmes d'information LIRIS UMR 5205 CNRS/INSA de
Plus en détailIntroduction au Data-Mining
Introduction au Data-Mining Alain Rakotomamonjy - Gilles Gasso. INSA Rouen -Département ASI Laboratoire PSI Introduction au Data-Mining p. 1/25 Data-Mining : Kèkecé? Traduction : Fouille de données. Terme
Plus en détailFICHE FISCALITE 2014 LA FISCALITÉ AUTOMOBILE : GÉNÉRALITÉS & SPÉCIFICITÉS POUR LES VÉHICULES PARTICULIERS MÉMENTO SUR LA FISCALITÉ AUTOMOBILE.
FICHE FISCALITE 2014 MÉMENTO SUR LA FISCALITÉ AUTOMOBILE Page 1 SOMMAIRE LES AVANTAGES EN NATURE :... 3 2 modes de calcul :... 3 Mode n 1 : le calcul selon les dépenses au réel :... 3 Mode n 2 : le calcul
Plus en détailLa structure de la base de données et l utilisation de PAST. Musée Royal de l Afrique Centrale (MRAC Tervuren)
La structure de la base de données et l utilisation de PAST La structure de la base de données données originales SPÉCIMENS Code des spécimens: Identification des spécimens individuels. Dépend du but de
Plus en détailSECTEUR AUTOMOBILE SUR UNE NOUVELLE VOIE
PRODUCTIVITÉ RESPONSABLE ENVIRONNEMENT AUTOMOBILES SECTEUR AUTOMOBILE SUR UNE NOUVELLE VOIE PAR MARK CARDWELL PHOTOS ATLAS COPCO/ISTOCKPHOTO/GEELY Àl heure où les économies mondiales se relèvent de la
Plus en détailTARIFS DE LOCATION VOITURES
TARIFS DE LOCATION VOITURES TABLE DES MATIERES Page. RCA 01 Montants des franchises Franchises pour vol et suppléments pour élimination / réduction de la franchise 01 Franchises pour dommages et suppléments
Plus en détailCours 7 : Utilisation de modules sous python
Cours 7 : Utilisation de modules sous python 2013/2014 Utilisation d un module Importer un module Exemple : le module random Importer un module Exemple : le module random Importer un module Un module est
Plus en détailExposing a test of homogeneity of chronological series of annual rainfall in a climatic area. with using, if possible, the regional vector Hiez.
Test d homogéné$é Y. BRUNET-MORET Ingénieur hydrologue, Bureau Central Hydrologique Paris RÉSUMÉ Présentation d un test d homogénéi.té spécialement conçu pour vérijier Z homogénéité des suites chronologiques
Plus en détail24 ème salon TECHNO-CLASSICA ESSEN 2012 le salon mondial des passionnés de l automobile
24 ème salon TECHNO-CLASSICA ESSEN 2012 le salon mondial des passionnés de l automobile Le plus grand salon international de voitures classiques se tient du 21* au 25 mars 2012 * 21 mars 2012 : Pré-salon,
Plus en détailChapitre 3. Les distributions à deux variables
Chapitre 3. Les distributions à deux variables Jean-François Coeurjolly http://www-ljk.imag.fr/membres/jean-francois.coeurjolly/ Laboratoire Jean Kuntzmann (LJK), Grenoble University 1 Distributions conditionnelles
Plus en détailApprentissage Automatique
Apprentissage Automatique Introduction-I jean-francois.bonastre@univ-avignon.fr www.lia.univ-avignon.fr Définition? (Wikipedia) L'apprentissage automatique (machine-learning en anglais) est un des champs
Plus en détailSujet proposé par Yves M. LEROY. Cet examen se compose d un exercice et de deux problèmes. Ces trois parties sont indépendantes.
Promotion X 004 COURS D ANALYSE DES STRUCTURES MÉCANIQUES PAR LA MÉTHODE DES ELEMENTS FINIS (MEC 568) contrôle non classant (7 mars 007, heures) Documents autorisés : polycopié ; documents et notes de
Plus en détailassociation adilca www.adilca.com LE COUPLE MOTEUR
LE COUPLE MOTEUR Quelles sont les caractéristiques essentielles d un véhicule à moteur? Les services marketing le savent, c est la puissance et la vitesse maximale qui, au premier abord, focalisent l attention
Plus en détailApplication Form/ Formulaire de demande
Application Form/ Formulaire de demande Ecosystem Approaches to Health: Summer Workshop and Field school Approches écosystémiques de la santé: Atelier intensif et stage d été Please submit your application
Plus en détailArbres binaires de décision
1 Arbres binaires de décision Résumé Arbres binaires de décision Méthodes de construction d arbres binaires de décision, modélisant une discrimination (classification trees) ou une régression (regression
Plus en détail