CLASSIFICATION ESIEA 5 ème année 2009/200
Les données Modèle Cylindrée Puissance Vitesse Poids Longueur Largeur Honda Civic 396 90 74 850 369 66 Renault 9 72 92 80 965 45 69 Fiat Tipo 580 83 70 970 395 70 Peugeot 405 769 90 80 080 440 69 Renault 2 2068 88 80 35 446 70 Citroën BX 769 90 82 060 424 68 BMW 530i 2986 88 226 50 472 75 Rover 827i 2675 77 222 365 469 75 Renault 25 2548 82 226 350 47 80 Opel Omega 998 22 90 255 473 77 Peugeot 405 Break 905 25 94 20 439 7 Ford Sierra 993 5 85 90 45 72 BMW 325ix 2494 7 208 300 432 64 Audi 90 Quattro 994 60 24 220 439 69 Ford Scorpio 2933 50 200 345 466 76 Renault Espace 995 20 77 265 436 77 Nissan Vanette 952 87 44 430 436 69 VW Caravelle 209 2 49 320 457 84 Ford Fiesta 7 50 35 80 37 62 Fiat Uno 6 58 45 780 364 55 Peugeot 205 580 80 59 880 370 56 Peugeot 205 Rallye 294 03 89 805 370 57 Seat Ibiza SXI 46 00 8 925 363 6 Citroën AX Sport 294 95 84 730 350 60 2
3 Exemple Auto88 Le premier plan principal
4 Exemple Auto88 Le cercle des corrélations
La classification : «Qui se ressemble s assemble» 5
Dendrogramme 8 7 6 5 4 9 3 2 groups g p Choosing the cutting level l x x x Definition of the clusters 6
Classification ascendante hiérarchique (Méthode de Ward) X X p g 2 g X 2 g 3 X nin j 2 Distance de Ward : D(G i, G j ) = d ( gi, g j ) ( n n ) i j 7
Données centrées-réduites 2 3 4 5 6 7 8 9 0 2 3 4 5 6 7 8 9 20 2 22 23 24 Mean Std. Dev. Modèle Cylindrée Puissance Vitesse Poids Longueur Largeur Honda Civic -.966 -.60 -.360 -.33 -.272 -.370 Renault 9 -.35 -.559 -.22 -.633 -.59.022 Fiat Tipo -.68 -.79 -.59 -.62 -.643.52 Peugeot 405 -.260 -.60 -.22 -.34.445.022 Renault 2.307 -.662 -.22.05.59.52 Citroën BX -.260 -.60 -.043 -.22.058 -.09 BMW 530i 2.046.97.702.733.220.806 Rover 827i.456.633.543.04.47.806 Renault 25.26.762.702.039.95.459 Opel Omega.74.25.274.626.244.067 Peugeot 405 Break -.002.292.433.040.42.283 Ford Sierra.65.034.076.344.72.44 BMW 325ix.4.478.988.82.252 -.63 Audi 90 quattro.66.95.226.474.42.022 Ford Scorpio.945.937.67.07.074.936 Renault Espace.68.63 -.24.669.349.067 Nissan Vanette.087 -.688 -.550.386.349.022 VW Caravelle.384 -.043 -.352.908.857.982 Ford Fiesta -.495 -.642 -.907 -.306 -.224 -.893 Fiat Uno -.497 -.435 -.50 -.437 -.393 -.807 Peugeot 205 -.68 -.868 -.955 -.002 -.248 -.677 Peugeot 205 rallye -.60 -.275.235 -.328 -.248 -.546 Seat Ibiza sxi -.843 -.352 -.083 -.807 -.47 -.023 Citroën AX sport -.60 -.48.036 -.654 -.732 -.54.000.000.000.000.000.000.000.000.000.000.000.000 Calculer la distance de Ward entre la BX et la 405? 8
Tableau des distances entre les voitures Proximity Matrix Squared Euclidean Distance Case :Honda Civic 2:Renault 9 3:Fiat Tipo 4:Peugeot 405 5:Renault 2 6:Citroën BX 23:Seat Ibiza sxi 24:Citroën AX sport :Honda Civic 2.079.9 4.657 6.954 3.270....73.309 2:Renault 9 2.079.534.626.567.252 2.992 5.582 3:Fiat Tipo.9.534.748 3.064.00 2.453 4.676 4:Peugeot 405 4.657.626.748.49.8 5.423 9.283 5:Renault 2 6.954.567 3.064.49.787 7.665 2.400 6:Citroën BX 3.270.252.00.8.787... 23:Seat Ibiza sxi.73 2.992 2.453 5.423 7.665 3.766.964 24:Citroën AX sport.309 5.582582 4.676 9.283 2.400 7.83.964 This is a dissimilarity matrix 9 D(Citroën BX, Peugeot 405) =.8.0905 ( )
Classification Ascendante Hiérarchique Etape initiale Chaque individu forme une classe. On regroupe les deux individus les plus proches. Etape courante A chaque étape, on regroupe les deux classes G i et G j minimisant le critère de Ward D(G i, G j j) ). 0
H I E R A R C H I C A L C L U S T E R A N A L Y S I S Dendrogram using Ward Method Rescaled ed Distance Cluster Combine C A S E 0 5 0 5 20 25 Label Num +---------+---------+---------+---------+---------+ Peugeot 405 4 òø Citroën BX 6 òú Renault 9 2 òú Renault 2 5 òôòòòø Fiat Tipo 3 ò ó Peugeot 405 Break òø ùòòòòòòòòòòòòòòòòòø Ford Sierra 2 òôòø ó ó Opel Omega 0 òú ùò ó Renault Espace 6 ò ó ó Nissan Vanette 7 òûò ùòòòòòòòòòòòòòòòòòòòòòòòòòø VW Caravelle 8 ò ó ó BMW 325ix 3 òûòø ó ó Audi 90 quattro 4 ò ó ó ó Rover 827i 8 òø ùòòòòòòòòòòòòòòòòòòò ó Renault 25 9 òú ó ó BMW 530i 7 òôò ó Ford Scorpio 5 ò ó Peugeot 205 rallye 22 òø ó Citroën AX sport 24 òôòø ó Honda Civic òú ó ó Seat Ibiza sxi 23 ò ùòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòò Ford Fiesta 9 òø ó Fiat Uno 20 òôò Peugeot 205 2 ò
Qualité de la typologie en K classes La somme des carrés expliquée par la typologie en K classes est égale à la somme des carrés inter-classes de la typologie en K classes. La qualité de la typologie est mesurée par la part de la somme des carrés totale expliquée par la typologie. 2
Décomposition de l inertie totale X X p g 2 g g g 3 X 2 n i 2 I(N,g) d (g i,g) K K i I(G i,g i i n i n Inertie totale = p = Inertie inter-classes + Inertie intra-classes 3 n )
4 Coefficient : Somme des carrés intra-classes de la typologie en K classes Stage 2 3 4 5 6 7 8 9 0 2 3 4 5 6 7 8 9 20 2 Agglomeration Schedule Résultats SPSS : Somme des carrés intra-classes Stage Cluster First Part de somme des carrés Cluster Combined Appears Cluster Cluster 2 Coefficients Cluster Cluster 2 Next Stage totale expliquée par la 4 6.09035 0 0 3 typologie en K classes : 2.29804 0 0 2 2 4.56054 0 9 (38 - Coeff[n-K])/38 8 9.82705 0 0 0 22 24.486 0 0 3 23.476 0 0 3 0 6 2.00686 0 0 2 9 20 2.54783 0 0 5 2 5 3.5285 3 0 4 7 8 3.88960 0 4 6 3 4 4.69472 0 0 20 0 5.5378 7 2 8 22 6.45948 6 5 9 2 3 7.5575 9 0 2 9 2 8.9356 8 0 9 7 5 0.32859 0 0 20 7 8 2.76377 0 0 8 0 7 7.3547 2 7 2 9 22.53230 3 5 23 7 3 27.74035 6 22 2 0 34.47233 4 8 22 2 7 67.3438 2 20 23 2 38.00000 9 22 0 Part de somme des carrés totale expliquée par la typologie en 2 classes : (38-67.344)/38 = 0.52 Somme des carrés intra-classes pour la typologie en K=2 classes 22 Somme des carrés 23 totale = p(n-) Distance de Ward(4,6)
Premier plan principal i et typologie 2 Peugeot 205 rallye BMW 325ix 0 - Citroën AX sport Audi 90 quattro Seat Ibiza sxi BMW 530i Rover 827i Renault 25 Peugeot 205 Honda Civic Peugeot 405 Break Fiat Uno Renault 9 Ford Scorpio Citroën BX Fiat Tipo Peugeot 405Ford Sierra Renault 2 Opel Omega Ford Fiesta Renault Espace Nissan Vanette Ward Method Facte eur 2-2 -3-2.0 -.5 -.0 -.5 0.0 VW Caravelle.5.0.5 2.0 3 2 5 Facteur
6
Interprétation des classes Report Mean Ward Method 2 3 Total Cylindrée 322.57 896.27 2605.00 906.2 Puissance 82.29 02.8 7.33 3.67 Vitesse 66.7 75.55 26.00 83.08 Poids 825.7 62.73 348.33 0.83 Longueur 365.29 437.45 458.7 42.58 Largeur 59.57 72.36 73.7 68.83 7
Interprétation epéa descasses classes 3 2 VW Caravelle BMW 530i CYLINDREE 0 PUISSANCE Fiat Tipo - VITESSE -2 Citroën AX sport VW Caravelle Nissan Vanette POIDS LONGUEUR -3 LARGEUR N = 7 7 7 7 7 7 6 6 6 6 6 6 2 3 8 Ward Method