ESIEA PARIS 00-0 Exame MAT 50 DATA MINING Vedredi 6 Novembre 00 Première Partie : 5 miutes Eseigat resposable : Frédéric Bertrad Remarque importat : les questios de ce questioaire sot posées das le cotexte d u cours de DATA MINING. Ue seule répose est correcte par questio.. Que sigifie AFC? a) Aalyse factorielle des correspodaces b) Aalyse foctioelle cetrée c) Aalyse fractale des corrélatios. Que sigifie ADL? a) Aalyse des lois b) Aticipatio des lies c) Aalyse discrimiate liéaire 3. Que sigifie CRM? a) Cetre de Recherche e Mathématiques b) Classificatio des Relatios Maximales c) Customer Relatioship Maagemet 4. Que sigifie PLS? a) Partial least squares b) Prévisio liéaire simple c) Partitioemets logiques successifs 5. Le Data Miig est-il utilisé e CRM? Doez u exemple de problématique liée à so utilisatio. a) No. b) Oui... 6. Que sigifie AUC? a) Aire uilatérale calculée b) Area uder the curve c) Amélioratio de l utilisatio de la coaissace 7. Que sigifie ANOVA? a) Aalyse Normalisée et Orietée des Variables Auxiliaires b) Associatio Natioale Orietée des Vetes et des Assuraces c) ANalysis Of VAriace 8. Combie de grades familles de techiques de DATA MINING sot présetées das ce cours? Citez-les das le cas que vous avez choisi. a) Ue.. b) Deux...
ESIEA PARIS 00-0 c) Trois... 9. Que sigifie GRC? a) Groupe de Recherche e Cryptographie b) Gestio de la Relatio Cliet c) Geeral Regressio Classificatio 0. Les techiques factorielles sot-elles utiles e Data Miig? Si oui, doez u exemple de problématique liée à so utilisatio. a) No. b) Oui.... Pour étudier les habitudes de cosommatio des cliets d u supermarché, o utilisera : a) Des règles d associatio b) Des règles de dissociatio c) Ue techique prédictive. Ue AFC se réalise a) Sur des variables qualitatives b) Sur des variables quatitatives c) Sur des variables mixtes 3. La commade sous R pour réaliser ue ACP est a) res.pca() b) PCA() c) plot() 4. La commade sous R pour réaliser ue AFC est a) res.ca() b) CA() c) plot() 5. Que sigifie CAH? a) Classemet Ascedat Hiérarchique b) Classemet Automatique et Homogèe c) Classificatio Ascedate Hiérarchique
E.S.I.E.A Paris Aée scolaire 00/0 UE de ciquième aée : MAT 50 - Data Miig Eseigat Resposable : F. Bertrad Chaque répose devra être justifiée précisémet. E aexe sot doés le joural et la sortie d u traitemet avec le logiciel R. Exercice : O s itéresse au climat des différets pays d Europe. Pour cela, o a recueilli les températures moyees mesuelles (e degrés Celsius) pour les pricipales capitales européees aisi que pour certaies grades villes. Ces doées sot fouries das le tableau. E plus des températures mesuelles, o doe das le tableau, pour chaque ville, la température moyee auelle aisi que l amplitude thermique (différece etre la moyee mesuelle maximum et la moyee mesuelle miimum d ue ville). O doe égalemet deux variables de positioemet (la logitude et la latitude) aisi qu ue variable (l apparteace à ue régio d Europe, variable à quatre modalités : Europe du ord, du sud, de l est, de l ouest).. Décrire le jeu de doées (ombre d idividus, ombre de variables, ature des variables). Quelles sot les variables qui ot été utilisées pour réaliser l ACP?. Que pouvez-vous dire à partir des doées brutes (tableau et figure )? 3. Que pouvez-vous dire à partir des doées cetrées-réduites (tableau 5 et figure )? 4. O veut effectuer ue ACP sur ce jeu de doées : quels sot les objectifs d ue telle aalyse? Quel peut être l itérêt d illustrer les résultats obteus avec des variables de positioemet ou d apparteace à ue régio d Europe. 5. Les variables ot été cetrées et réduites avat l aalyse. La réductio était-elle idispesable? Vous pourrez justifier ce choix e utilisat, par exemple, les iformatios coteues das les tableaux, 3, 4 et 6. Les tableaux 7, 8, 9, 0,,, 3, 4, 5 et 6 doet les PRINCIPAUX résultats de l ACP sur les idividus, les variables et les variables mises e supplémetaire. 6. Quelle est l iertie expliquée par le premier axe de l ACP? Et par le premier pla? 7. Quelles sot les villes qui cotribuet le plus à la costructio des deux premiers axes? Que sigifie ue cotributio importate? 8. La figure 4 doe le graphe des idividus de l ACP. La figure 5 doe le graphe des variables. Iterpréter les facteurs pricipaux de l ACP à l aide de ces deux représetatios graphiques et des cotributios des idividus et des variables. 9. À partir du cercle de corrélatios, que pouvez-vous dire cocerat les corrélatios suivates ovembre-mars, javier-jui? Iterpréter les implicatios climatiques de ces corrélatios.
0. Certaies variables apparaisset e tirets et e bleu das le cercle des corrélatios. Expliquer pourquoi. Existe-t-il u lie etre la température moyee pedat les mois de l été et la latitude ou la logitude des villes? Commet est-il possible d expliquer les différeces d amplitude thermique etre les villes?. VRAI ou FAUX? Si FAUX, corriger la phrase proposée. Pour chacue des villes, la température moyee du mois d octobre est fortemet corrélée à la température moyee sur l aée. S il fait froid e javier, il fera froid e jui. La ville d Avers est bie représetée sur l axe. La variable jui a joué le rôle le plus importat das la costructio de l axe. La proximité de deux villes sur le premier pla factoriel implique systématiquemet qu elles ot deux profils de température moyee semblables au cours de l aée. La variable supplémetaire logitude est bie représetée sur le premier pla factoriel.
Tab. Doées brutes Javier Février Mars Avril Mai Jui Juillet Août Septembre Octobre Novembre Décembre Amsterdam.9.5 5.7 8..5 4.8 7. 7. 4.5.4 7.0 4.4 Athèes 9. 9.7.7 5.4 0. 4.5 7.4 7. 3.8 9. 4.6.0 Berli -0. 0. 4.4 8. 3.8 6.0 8.3 8.0 4.4 0.0 4.. Bruxelles 3.3 3.3 6.7 8.9.8 5.6 7.8 7.8 5.0. 6.7 4.4 Budapest -. 0.8 5.5.6 7.0 0..0.3 6.9.3 5. 0.7 Copehague -0.4-0.4.3 5.8. 5.4 7. 6.6 3.3 8.8 4..3 Dubli 4.8 5.0 5.9 7.8 0.4 3.3 5.0 4.6.7 9.7 6.7 5.4 Helsiki -5.8-6. -.7 3. 0. 4.0 7. 4.9 9.7 5. 0. -.3 Kiev -5.9-5.0-0.3 7.4 4.3 7.8 9.4 8.5 3.7 7.5. -3.6 Cracovie -3.7 -.0.9 7.9 3. 6.9 8.4 7.6 3.7 8.6.6 -.7 Lisboe 0.5.3.8 4.5 6.7 9.4.5.9 0.4 7.4 3.7. Lodres 3.4 4. 5.5 8.3.9 5. 6.9 6.5 4.0 0. 6.3 4.4 Madrid 5.0 6.6 9.4. 6.0 0.8 4.7 4.3 9.8 3.9 8.7 5.4 Misk -6.9-6. -.9 5.4.4 5.9 7.4 6.3.6 5.8 0. -4. Moscou -9.3-7.6 -.0 6.0 3.0 6.6 8.3 6.7. 5. -. -6.0 Oslo -4.3-3.8-0.6 4.4 0.3 4.9 6.9 5.4. 5.7 0.5 -.9 Paris 3.7 3.7 7.3 9.7 3.7 6.5 9.0 8.7 6..5 7.3 5. Prague -.3 0. 3.6 8.8 4.3 7.6 9.3 8.7 4.9 9.4 3.8 0.3 Reykjavik -0.3 0. 0.8.9 6.5 9.3. 0.6 7.9 4.5.7 0. Rome 7. 8. 0.5 3.7 7.8.7 4.4 4. 0.9 6.5.7 8.3 Sarajevo -.4 0.8 4.9 9.3 3.8 7.0 8.9 8.7 5. 0.5 5. 0.8 Sofia -.7 0. 4.3 9.7 4.3 7.7 0.0 9.5 5.8 0.7 5.0 0.6 Stockholm -3.5-3.5 -.3 3.5 9. 4.6 7. 6.0.7 6.5.7 -.6 Avers 3..9 6. 8.9.9 5.5 7.9 7.6 4.7.5 6.8 4.7 Barceloe 9. 0.3.8 4. 7.4. 4. 4..7 7.5 3. 0.0 Bordeaux 5.6 6.7 9.0.9 5.0 8.3 0.4 0.0 7.6 3.5 8.5 6. Edimbourg.9 3.6 4.7 7. 9.9 3.0 4.7 4.3. 8.7 5.3 3.7 Fracfort 0..8 5.4 9.7 4.3 7.5 9.0 8.3 4.8 9.8 4.9.7 Geève 0..9 5. 9.4 3.8 7.3 9.4 8.5 5.0 9.8 4.9.4 Gèes 8.7 8.7.4 3.8 7.5.0 4.5 4.6.8 7.8. 0.0 Mila. 3.6 8.0.6 7.3.3 3.8.8 8.9 3. 6.9.6 Palerme 0.5.5 3.3 6.9 0.9 3.8 4.5.3.3 8.4 4.9.0 Séville 0.7.8 4. 6. 9.7 3.4 6.7 6.7 4.3 9.4 4.5. St. Pétersbourg -8. -7.9-3.7 3. 0.0 5.4 8.4 6.9.5 5. -0.4-5.3 Zurich -0.7 0.7 4.3 8.5.9 6. 8.0 7. 4. 8.9 3.9 0.3 3
Moyee Amplitude Latitude Logitude Régio Amsterdam 9.9 4.6 5. 4.5 Ouest Athèes 7.8 8.3 37.6 3.5 Sud Berli 9. 8.5 5.3 3. Ouest Bruxelles 0.3 4.4 50.5 4. Ouest Budapest 0.9 3. 47.3 9.0 Est Copehague 7.8 7.5 55.4.3 Nord Dubli 9.3 0. 53. 6. Nord Helsiki 4.8 3.4 60. 5.0 Nord Kiev 7. 5.3 50.3 30.3 Est Cracovie 7.7. 50.0 9.6 Est Lisboe 5.9.4 38.4 9. Sud Lodres 9.7 3.5 5.4 0.0 Nord Madrid 3.9 9.7 40. 3.4 Sud Misk 5.5 4.3 53.5 7.3 Est Moscou 5. 7.6 46..5 Est Oslo 5.6. 59.5 0.5 Nord Paris. 5.3 48.5. Ouest Prague 9. 0.6 50.0 4. Est Reykjavik 4.6.4 64..6 Nord Rome 5.4 7.3 4.5.3 Sud Sarajevo 9.4 0.3 43.5 8.3 Sud Sofia 9.6.7 4.4 3. Est Stockholm 5.8 0.7 59. 8.0 Nord Avers 0.3 5.0 5. 4. Ouest Barceloe 6. 5. 4.. Sud Bordeaux.7 4.8 44.5 0.3 Ouest Edimbourg 8.3.8 55.0 3.0 Nord Fracfort 9.8 8.8 50. 8.4 Ouest Geève 9.7 9.3 46. 6. Ouest Gèes 6. 5.9 44.3 9.4 Sud Mila.6.7 45.3 9. Sud Palerme 6.6 4.0 38. 3. Sud Séville 8. 6.0 37. 5.6 Sud St. Pétersbourg 4.5 6.6 59.6 30. Est Zurich 8.7 8.7 47. 8.3 Ouest Tab. Iformatios complémetaires sur les villes Javier Février Mars Avril Mai Jui Variace 30.7 30.4 3.65 4.49 0.7.0 Juillet Août Septembre Octobre Novembre Décembre Variace.78 3.90 6.89 8.69 0.86 4.68 Tab. 3 Variace des températures par mois 4
Javier Février Mars Avril Mai Jui Mi. :-9.300 Mi. :-7.900 Mi. :-3.700 Mi. :.900 Mi. : 6.50 Mi. : 9.30 st Qu.:-.550 st Qu.:-0.50 st Qu.:.600 st Qu.: 7.50 st Qu.:.5 st Qu.:5.40 Media : 0.00 Media :.900 Media : 5.400 Media : 8.900 Media :3.80 Media :6.90 Mea :.346 Mea :.7 Mea : 5.9 Mea : 9.83 Mea :3.9 Mea :7.4 3rd Qu.: 4.900 3rd Qu.: 5.800 3rd Qu.: 8.500 3rd Qu.:.050 3rd Qu.:6.35 3rd Qu.:9.80 Max. :0.700 Max. :.800 Max. :4.00 Max. :6.900 Max. :0.90 Max. :4.50 Juillet Août Septembre Octobre Novembre Décembre Mi. :.0 Mi. :0.60 Mi. : 7.90 Mi. : 4.50 Mi. :-.00 Mi. :-6.00 st Qu.:7.30 st Qu.:6.65 st Qu.:3.00 st Qu.: 8.65 st Qu.: 3.00 st Qu.: 0.5 Media :8.90 Media :8.30 Media :4.80 Media :0.0 Media : 5.00 Media :.70 Mea :9.6 Mea :8.98 Mea :5.63 Mea :.00 Mea : 6.066 Mea :.88 3rd Qu.:.75 3rd Qu.:.60 3rd Qu.:8.5 3rd Qu.:3.30 3rd Qu.: 7.900 3rd Qu.: 5.40 Max. :7.40 Max. :7.0 Max. :4.30 Max. :9.40 Max. :4.900 Max. :.00 Javier Février Mars Avril Mai Jui Juillet Août Septembre Octobre Novembre Décembre Javier.00 0.99 0.96 0.83 0.64 0.57 0.57 0.64 0.8 0.9 0.97 0.99 Février 0.99.00 0.98 0.88 0.69 0.6 0.6 0.69 0.85 0.93 0.97 0.98 Mars 0.96 0.98.00 0.95 0.80 0.7 0.7 0.78 0.9 0.96 0.97 0.96 Avril 0.83 0.88 0.95.00 0.94 0.89 0.86 0.90 0.97 0.96 0.9 0.85 Mai 0.64 0.69 0.80 0.94.00 0.97 0.94 0.94 0.94 0.88 0.79 0.68 Jui 0.57 0.6 0.7 0.89 0.97.00 0.98 0.96 0.93 0.83 0.74 0.6 Juillet 0.57 0.6 0.7 0.86 0.94 0.98.00 0.99 0.93 0.84 0.74 0.6 Août 0.64 0.69 0.78 0.90 0.94 0.96 0.99.00 0.96 0.89 0.79 0.68 Septembre 0.8 0.85 0.9 0.97 0.94 0.93 0.93 0.96.00 0.97 0.9 0.84 Octobre 0.9 0.93 0.96 0.96 0.88 0.83 0.84 0.89 0.97.00 0.98 0.93 Novembre 0.97 0.97 0.97 0.9 0.79 0.74 0.74 0.79 0.9 0.98.00 0.98 Décembre 0.99 0.98 0.96 0.85 0.68 0.6 0.6 0.68 0.84 0.93 0.98.00 Tab. 4 Statistiques descriptives et corrélatios des doées brutes 5
Amsterdam Athèes Berli Bruxelles Budapest Copehague Dubli Helsiki Kiev Cracovie Lisboe Lodres Madrid Misk Moscou Oslo Paris Prague Reykjavik Rome Sarajevo Sofia Stockholm Avers Barceloe Bordeaux Edimbourg Fracfort Geève Avril Mai Gèes Mars Février Jui Javier Mila Palerme Séville St. Pétersbourg Juillet Août Zurich Septembre Décembre Novembre Octobre Fig. Température par ville, doées brutes 6
Tab. 5 Doées cetrées-réduites Javier Février Mars Avril Mai Jui Juillet Août Septembre Octobre Novembre Décembre Amsterdam 0.8 0.05 0.0-0.8-0.43-0.79-0.7-0.50-0.8 0.09 0.0 0.3 Athèes.4.36.33.6.89.3.8.0.99.90.87.63 Berli -0.8-0.39-0.7-0.8-0.03-0.43-0.37-0.6-0.30-0.3-0.4-0.34 Bruxelles 0.36 0.0 0.30-0.0-0.34-0.55-0.5-0.3-0.5 0.0 0.4 0.3 Budapest -0.44-0.6 0.06 0.6 0.94 0.84 0.66 0.6 0.3 0.07-0. -0.44 Copehague -0.3-0.48-0.8-0.9-0.86-0.6-0.7-0.64-0.57-0.5-0.43-0.3 Dubli 0.63 0.5 0.4-0.39 -.07 -.4 -.9 -.7-0.7-0.30 0.4 0.5 Helsiki -.30 -.53 -.63 -.6 -.3 -.03-0.68 -.09 -.44 -.34 -.3 -.04 Kiev -.3 -.3 -.4-0.49 0. 0. -0.06-0.3-0.47-0.8 -.07 -.30 Cracovie -0.9-0.77-0.68-0.36-0. -0.5-0.34-0.37-0.47-0.56-0.76-0.9 Lisboe.66.65.56.37 0.85 0.60 0.53 0.78.6.48.67.65 Lodres 0.37 0.36 0.06-0.6-0.6-0.70-0.76-0.67-0.40-0.9 0.05 0.3 Madrid 0.66 0.80 0.86 0.77 0.64.0.4.43.0 0.67 0.58 0.5 Misk -.50 -.53 -.47 -.0-0.46-0.46-0.6-0.7-0.98 -.0 -.3 -.43 Moscou -.93 -.79 -.49-0.86-0.8-0.5-0.37-0.6 -.08 -.37 -.57 -.79 Oslo -.03 -.09 -.0 -.8 -.0-0.76-0.76-0.96 -.0 -.3 -. -.6 Paris 0.43 0.7 0.43 0. -0.06-0.8-0.7-0.08 0. 0.35 0.7 0.47 Prague -0.48-0.37-0.33-0.3 0. 0.06-0.09-0.08-0.8-0.37-0.50-0.5 Reykjavik -0.30-0.39-0.9 -.68 -.6 -.44 -.38 -.5 -.88 -.50-0.96-0.54 Rome.05.09.08.6.9.9.34.37.8.7.3.09 Sarajevo -0.50-0.6-0.07 0.00-0.03-0. -0.0-0.08-0.0-0. -0. -0.4 Sofia -0.55-0.37-0.9 0. 0. 0.09 0. 0.4 0.04-0.07-0.3-0.46 Stockholm -0.88 -.04 -.34 -.5 -.44-0.85-0.68-0.80-0.96 -.04-0.96-0.90 Avers 0.3 0. 0.0-0.0-0.3-0.58-0.48-0.37-0.3 0. 0.6 0.37 Barceloe.4.47.35.7.07.4.8.37.48.50.54.43 Bordeaux 0.77 0.8 0.78 0.69 0.33 0.7 0. 0.7 0.48 0.58 0.53 0.65 Edimbourg 0.8 0.5-0. -0.57 -.3 -.33 -.38 -.6-0.86-0.53-0.7 0.7 Fracfort -0. -0.08 0.04 0. 0. 0.03-0.7-0.8-0.0-0.8-0.6-0.4 Geève -0.3-0.06-0.03 0.03-0.03-0.03-0.06-0.3-0.5-0.8-0.6-0.30 Gèes.34.8.7.9.0.08.36.5.50.57.34.43 Mila -0.04 0.5 0.57 0.87.04.7.7.0 0.80 0.49 0.8-0.06 Palerme.66.69.66.00.3.9.36 0.89.6.7.93.84 Séville.70.74.8.79.77.80.98.07..94.85.67 St. Pétersbourg -.73 -.84 -.84 -.60 -.9-0.6-0.34-0.56 -.0 -.34 -.4 -.65 Zurich -0.37-0.8-0.9-0. -0.3-0.37-0.45-0.48-0.37-0.49-0.47-0.5 7
Javier Février Mars Avril Mai Jui Mi. :-.935e+00 Mi. :-.840e+00 Mi. :-.836e+00 Mi. :-.677e+00 Mi. :-.64e+00 Mi. :-.444e+00 st Qu.:-5.63e-0 st Qu.:-4.305e-0 st Qu.:-7.46e-0 st Qu.:-5.34e-0 st Qu.:-5.38e-0 st Qu.:-6.067e-0 Media :-.08e-0 Media :-5.767e-0 Media : 3.55e-0 Media :-.006e-0 Media :-3.404e-0 Media :-.549e-0 Mea :.57e-7 Mea :.08e-7 Mea :.45e-7 Mea :-.55e-7 Mea :.59e-6 Mea :-6.700e-7 3rd Qu.: 6.460e-0 3rd Qu.: 6.56e-0 3rd Qu.: 6.77e-0 3rd Qu.: 7.70e-0 3rd Qu.: 7.449e-0 3rd Qu.: 7.85e-0 Max. :.700e+00 Max. :.743e+00 Max. :.84e+00 Max. :.00e+00 Max. :.35e+00 Max. :.34e+00 Juillet Août Septembre Octobre Novembre Décembre Mi. :-.384e+00 Mi. :-.48e+00 Mi. :-.88e+00 Mi. :-.504e+00 Mi. :-.569e+00 Mi. :-.788e+00 st Qu.:-6.498e-0 st Qu.:-6.50e-0 st Qu.:-6.403e-0 st Qu.:-5.44e-0 st Qu.:-6.75e-0 st Qu.:-5.95e-0 Media :-.0e-0 Media :-.84e-0 Media :-.03e-0 Media :-.857e-0 Media :-.5e-0 Media :-.375e-0 Mea :-9.94e-7 Mea :-4.6e-7 Mea :-8.743e-7 Mea :-.95e-6 Mea :-4.839e-7 Mea : 3.39e-7 3rd Qu.: 5.95e-0 3rd Qu.: 7.08e-0 3rd Qu.: 6.37e-0 3rd Qu.: 5.33e-0 3rd Qu.: 4.07e-0 3rd Qu.: 5.073e-0 Max. :.76e+00 Max. :.05e+00 Max. :.09e+00 Max. :.94e+00 Max. :.934e+00 Max. :.836e+00 Javier Février Mars Avril Mai Jui Juillet Août Septembre Octobre Novembre Décembre Javier.00 0.99 0.96 0.83 0.64 0.57 0.57 0.64 0.8 0.9 0.97 0.99 Février 0.99.00 0.98 0.88 0.69 0.6 0.6 0.69 0.85 0.93 0.97 0.98 Mars 0.96 0.98.00 0.95 0.80 0.7 0.7 0.78 0.9 0.96 0.97 0.96 Avril 0.83 0.88 0.95.00 0.94 0.89 0.86 0.90 0.97 0.96 0.9 0.85 Mai 0.64 0.69 0.80 0.94.00 0.97 0.94 0.94 0.94 0.88 0.79 0.68 Jui 0.57 0.6 0.7 0.89 0.97.00 0.98 0.96 0.93 0.83 0.74 0.6 Juillet 0.57 0.6 0.7 0.86 0.94 0.98.00 0.99 0.93 0.84 0.74 0.6 Août 0.64 0.69 0.78 0.90 0.94 0.96 0.99.00 0.96 0.89 0.79 0.68 Septembre 0.8 0.85 0.9 0.97 0.94 0.93 0.93 0.96.00 0.97 0.9 0.84 Octobre 0.9 0.93 0.96 0.96 0.88 0.83 0.84 0.89 0.97.00 0.98 0.93 Novembre 0.97 0.97 0.97 0.9 0.79 0.74 0.74 0.79 0.9 0.98.00 0.98 Décembre 0.99 0.98 0.96 0.85 0.68 0.6 0.6 0.68 0.84 0.93 0.98.00 Tab. 6 Statistiques descriptives et corrélatios des doées cetrées-réduites 8
Amsterdam Athèes Berli Bruxelles Budapest Copehague Dubli Helsiki Kiev Cracovie Lisboe Lodres Madrid Misk Moscou Oslo Paris Prague Reykjavik Rome Sarajevo Sofia Stockholm Avers Barceloe Bordeaux Edimbourg Fracfort Geève Avril Mai Gèes Mars Février Jui Javier Mila Palerme Séville St. Pétersbourg Juillet Août Zurich Septembre Décembre Novembre Octobre Fig. Température par ville, doées cetrées-réduites 9
Dim. Dim. Dim.3 Dim.4 Dim.5 Amsterdam -0.55 -.5 0.0 0. -0.35 Athèes 6.8 0.96 0.5 0.30 0.0 Berli -.0 0.03-0. -0.05-0.4 Bruxelles -0.7 -.07-0.04-0.09-0.4 Budapest 0.80.6-0.49-0.0 0.0 Copehague -.0-0.4 0.40 0.3 0.0 Dubli -.3 -.47-0.0 0.03 0. Helsiki -4.46 0.46 0.46 0.37 0.05 Kiev -.3.88-0. 0. -0.08 Cracovie -.9 0.83-0.6-0.03-0.05 Lisboe 4.4 -.40-0.3 0.03-0.3 Lodres -0.70 -.44-0.04 0.0 0. Madrid 3.0 0.74 0.50-0.5 0.8 Misk -3.73.30-0.4 0. -0.06 Moscou -3.94.03-0.38 0.06-0.0 Oslo -3.79 0.3 0. -0.0 0.3 Paris 0.55-0.80 0.00-0.03-0. Prague -0.85 0.67-0.4-0.05 0.05 Reykjavik -5. -.75 0.0-0.0 0.5 Rome 4.3 0.34 0. 0.03 0.04 Sarajevo -0.6 0.3-0.6-0.7-0.0 Sofia -0.37 0.77-0.6-0.3-0.9 Stockholm -3.65 0.06 0.79 0.09 0.3 Avers -0. -.05-0.0 0.05-0. Barceloe 4.78-0.8 0.3-0.03 0.0 Bordeaux.88-0.65-0.9-0.6 0.08 Edimbourg -.95 -.7-0.0-0.06 0. Fracfort -0.39 0.6-0.43-0.09 0.3 Geève -0.45 0.8-0.3-0.8 0.4 Gèes 4.65-0.04 0.45-0.04-0. Mila.7.49-0.3-0.9 0. Palerme 5.99-0.8-0.7 0.73 0.9 Séville 6.5 0.33 0.9-0.3 0.00 St. Pétersbourg -4.45.53 0.73 0.06-0.04 Zurich -.3-0.04-0.3-0.9 0.07 Tab. 7 Coordoées des idividus 0
0 4 6 8 0 3 4 5 6 7 8 9 0 Fig. 3 Graphe des pourcetages d iertie des douze axes (sortie R)
Dimesio (.4%) 6 4 0 4 6 Est Nord Ouest Sud Moscou Kiev Budapest Misk Est Mila Cracovie Helsiki Prague Sofia Madrid Oslo Sarajevo Rome Stockholm Berli Fracfort Geève Sud Zurich Gèes Copehague Ouest ParisBordeaux Nord Amsterdam Bruxelles Avers Lodres Lisboe St. Pétersbourg Reykjavik Edimbourg Dubli Barceloe Palerme Athèes Séville 6 4 0 4 6 8 Dimesio (86.87%) Fig. 4 Graphe des idividus (sortie R)
Dimesio (.4%).0 0.5 0.0 0.5.0 Latitude Amplitude Logitude Juillet Jui Mai Août Septembre Avril Octobre Moyee Mars Novembre Décembre Février Javier.0 0.5 0.0 0.5.0 Dimesio (86.87%) Fig. 5 Graphe des variables (sortie R) 3
Dim. Dim. Dim.3 Dim.4 Dim.5 Amsterdam 0.5 0.78 0.00 0.0 0.06 Athèes 0.97 0.0 0.0 0.00 0.00 Berli 0.88 0.00 0.04 0.00 0.05 Bruxelles 0.03 0.94 0.00 0.0 0.0 Budapest 0.8 0.74 0.07 0.00 0.00 Copehague 0.9 0.04 0.03 0.0 0.00 Dubli 0.0 0.80 0.00 0.00 0.00 Helsiki 0.97 0.0 0.0 0.0 0.00 Kiev 0.60 0.39 0.0 0.00 0.00 Cracovie 0.8 0.5 0.0 0.00 0.00 Lisboe 0.9 0.09 0.00 0.00 0.00 Lodres 0.9 0.80 0.00 0.00 0.00 Madrid 0.89 0.05 0.0 0.03 0.0 Misk 0.89 0. 0.00 0.00 0.00 Moscou 0.78 0. 0.0 0.00 0.00 Oslo 0.99 0.0 0.00 0.00 0.00 Paris 0.30 0.63 0.00 0.00 0.05 Prague 0.57 0.36 0.05 0.00 0.00 Reykjavik 0.77 0. 0.00 0.00 0.00 Rome 0.99 0.0 0.00 0.00 0.00 Sarajevo 0.57 0.6 0.0 0.05 0.06 Sofia 0.6 0.7 0.03 0.0 0.04 Stockholm 0.95 0.00 0.04 0.00 0.00 Avers 0.04 0.9 0.00 0.00 0.04 Barceloe 0.99 0.00 0.00 0.00 0.00 Bordeaux 0.88 0.0 0.0 0.0 0.00 Edimbourg 0.45 0.55 0.00 0.00 0.00 Fracfort 0.39 0.06 0.47 0.0 0.04 Geève 0.58 0.0 0.6 0.09 0.06 Gèes 0.99 0.00 0.0 0.00 0.00 Mila 0.66 0.3 0.0 0.0 0.00 Palerme 0.97 0.00 0.0 0.0 0.00 Séville 0.99 0.00 0.00 0.00 0.00 St. Pétersbourg 0.87 0.0 0.0 0.00 0.00 Zurich 0.9 0.00 0.05 0.0 0.00 Tab. 8 Cos des idividus 4
Dim. Dim. Dim.3 Dim.4 Dim.5 Amsterdam 0.08 3.6 0.0 0.84 5.0 Athèes 0.8.9 6.5 6.8 0.00 Berli 0.8 0.00.00 0.0 7.07 Bruxelles 0.0.37 0.04 0.54.57 Budapest 0.7 5.4 5.73 0.65 0.0 Copehague. 0.37 3.86 3.66 0.0 Dubli 0.4.75 0.6 0.05.59 Helsiki 5.46 0.44 4.97 9.3 0.8 Kiev.48 7.36.7.0 0.85 Cracovie.00.43.6 0.08 0.33 Lisboe 5.33 4.09 0.38 0.08.99 Lodres 0.4 4.33 0.04 0.0.5 Madrid.50.4 5.84 8.45 9.50 Misk 3.8 3.53 0.48 3.8 0.47 Moscou 4.5 8.60 3.34 0.7 0.0 Oslo 3.94 0..06 0.00 6.4 Paris 0.08.34 0.00 0.06 6. Prague 0.0 0.93.4 0.8 0.37 Reykjavik 7.5 5.76 0.00 0.64.95 Rome 4.90 0.4.06 0.07 0. Sarajevo 0.0 0..59.06 4.90 Sofia 0.04.3 0.6. 4.4 Stockholm 3.65 0.0 4.84 0.5.09 Avers 0.0.3 0.0 0.8 6.00 Barceloe 6.7 0.6.4 0.07 0.00 Bordeaux 0.97 0.87 0.85.63 0.86 Edimbourg.05 9.80 0.6 0.6.59 Fracfort 0.04 0.05 4.36 0.54.97 Geève 0.06 0.07.30..6 Gèes 5.93 0.00 4.7 0.08 5.5 Mila.9 4.64.3 5.76.94 Palerme 9.8 0.06.0 36.36 0.33 Séville.64 0..04.0 0.00 St. Pétersbourg 5.43 4.88.55 0.3 0.7 Zurich 0.47 0.00.40.47 0.54 Tab. 9 Cotributios des idividus 5
Dim. Dim. Dim.3 Dim.4 Dim.5 Javier 0.89-0.46 0.05 0.0 0.03 Février 0.9-0.39-0.0-0.05 0.07 Mars 0.96-0.5-0.09-0.0-0.0 Avril 0.98 0.06-0.8-0.04-0.00 Mai 0.9 0.36-0.8 0.07-0.03 Jui 0.88 0.47-0.0 0.06 0.07 Juillet 0.88 0.46 0.3-0.0 0.04 Août 0.9 0.37 0.3-0.09-0.04 Septembre 0.99 0.4 0.05-0.0-0.0 Octobre 0.99-0.07 0.04 0.03-0.08 Novembre 0.97-0.4 0.04 0.07-0.0 Décembre 0.9-0.4 0.06 0.08-0.0 Tab. 0 Coordoées des variables Dim. Dim. Dim.3 Dim.4 Dim.5 Javier 0.89-0.46 0.05 0.0 0.03 Février 0.9-0.39-0.0-0.05 0.07 Mars 0.96-0.5-0.09-0.0-0.0 Avril 0.98 0.06-0.8-0.04-0.00 Mai 0.9 0.36-0.8 0.07-0.03 Jui 0.88 0.47-0.0 0.06 0.07 Juillet 0.88 0.46 0.3-0.0 0.04 Août 0.9 0.37 0.3-0.09-0.04 Septembre 0.99 0.4 0.05-0.0-0.0 Octobre 0.99-0.07 0.04 0.03-0.08 Novembre 0.97-0.4 0.04 0.07-0.0 Décembre 0.9-0.4 0.06 0.08-0.0 Tab. Corrélatios variables - dimesios Dim. Dim. Dim.3 Dim.4 Dim.5 Javier 0.79 0. 0.00 0.00 0.00 Février 0.84 0.5 0.00 0.00 0.0 Mars 0.9 0.06 0.0 0.0 0.00 Avril 0.96 0.00 0.03 0.00 0.00 Mai 0.83 0.3 0.03 0.00 0.00 Jui 0.77 0. 0.00 0.00 0.0 Juillet 0.77 0. 0.0 0.00 0.00 Août 0.83 0.4 0.0 0.0 0.00 Septembre 0.98 0.0 0.00 0.00 0.00 Octobre 0.99 0.0 0.00 0.00 0.0 Novembre 0.93 0.06 0.00 0.00 0.00 Décembre 0.8 0.6 0.00 0.0 0.00 Tab. Cos des variables 6
Dim. Dim. Dim.3 Dim.4 Dim.5 Javier 7.53 5.7.5 0.3 4.3 Février 8.04. 0.3 6.7.60 Mars 8.8 4.44 7.39 3.4 0.50 Avril 9. 0.4 7.75 3.3 0.0 Mai 7.98 9.45 5.6.3.88 Jui 7.39 5.99 0.6 8. 4.3 Juillet 7.37 5.43 3.4 0. 7.7 Août 8.00 0.03 5.06 7.55 6.8 Septembre 9.36.36.77.09.65 Octobre 9.46 0.38.03.48 7.3 Novembre 8.94 4.6.67.57.44 Décembre 7.90.0 3.49 4.9 0. Tab. 3 Cotributios des variables Dim. Dim. Dim.3 Dim.4 Dim.5 Moyee.00-0.06 0.0-0.03-0.0 Amplitude -0.39 0.9 0.04-0.0-0.0 Latitude -0.88-0.3 0. 0. 0.06 Logitude -0.33 0.46 0.5 0.34-0.08 Tab. 4 Coordoées des variables supplémetaires Dim. Dim. Dim.3 Dim.4 Dim.5 Moyee.00-0.06 0.0-0.03-0.0 Amplitude -0.39 0.9 0.04-0.0-0.0 Latitude -0.88-0.3 0. 0. 0.06 Logitude -0.33 0.46 0.5 0.34-0.08 Tab. 5 Corrélatios variables supplémetaires - dimesios Dim. Dim. Dim.3 Dim.4 Dim.5 Moyee 0.99 0.00 0.00 0.00 0.00 Amplitude 0.5 0.84 0.00 0.00 0.00 Latitude 0.77 0.05 0.05 0.0 0.00 Logitude 0. 0. 0.0 0. 0.0 Tab. 6 Cos des variables supplémetaires 7
Aalyse e Composates Pricipales (avec SPAD) et Classificatio Ascedate Hiérarchique Peiture représetat u étag (Tombeau de Thèbes, 400 av. J.-C.) C) extrait de l Histoire de l Art de Erst Gombrich Michel Teehaus Visualiser. Les objectifs de l aalyse e composates pricipales Décrire u tableau idividusvariables : - Résumer le tableau à l aide d u petit ombre de facteurs - Visualiser le positioemet des idividus les us par rapport aux autres - Visualiser les corrélatios etre les variables - Iterpréter les facteurs 4
Visualisatio des doées X X p F F i x i x pi F i F i Tableau des doées F (i) i 0 F (i) Le pla factoriel Cor(X j,f ) X j 0 Cor(X j,f ) Facteurs cetrés-réduits résumat les doées La carte des variables p Fh u j hjx j (o corrélés etre eux) 5 3. U exemple de positioemet de produits Caractéristiques de 4 modèles de voiture (Source : L argus de l automobile, 004) Modèle Cylidrée Puissace Vitesse Poids Largeur Logueur (cm 3 ) (ch) (km/h) (kg) (mm) (mm) Citroë C. Base 4 6 58 93 659 3666 Smart Fortwo Coupé 698 5 35 730 55 500 Mii.6 70 598 70 8 5 690 365 Nissa Micra. 65 40 65 54 965 660 375 Reault Clio 3.0 V6 946 55 45 400 80 38 Audi A3.9 TDI 896 05 87 95 765 403 Peugeot 307.4 HDI 70 398 70 60 79 746 40 Peugeot 407 3.0 V6 BVA 946 9 640 8 4676 Mercedes Classe C 70 CDI 685 70 30 600 78 458 BMW 530d 993 8 45 595 846 484 Jaguar S-Type.7 V6 Bi-Turbo 70 07 30 7 88 4905 BMW 745i 4398 333 50 870 90 509 Mercedes Classe S 400 CDI 3966 60 50 95 09 5038 Citroë C3 Pluriel.6i 587 0 85 77 700 3934 BMW Z4.5i 494 9 35 60 78 409 Audi TT.8T 80 78 80 8 80 764 404 Asto Marti Vaquish 5935 460 306 835 93 4665 Betley Cotietal GT 5998 560 38 385 98 4804 Ferrari Ezo 5998 660 350 365 650 4700 Reault Sceic.9 dci 0 870 0 88 430 805 459 Volkswage Toura.9 TDI 05 896 05 80 498 794 439 Lad Rover Defeder Td5 495 35 695 790 3883 Lad Rover Discovery Td5 495 38 57 75 90 4705 Nissa X-Trail. dci 84 36 80 50 765 4455 6 Logueur Largeur Puissace Cylidrée Graphiques e étoile des voitures Citroë C. Smart Fortwo Mii.6 70 Vitesse Nissa Micra. Reault Clio 3.0 V6 Audi A3.9 TDI Poids Peugeot 307.4 HDI 70 Peugeot 407 3.0 V6 Mercedes Classe C 70 BMW 530d Jaguar S-Type.7 V6 BMW 745i Mercedes Classe S 400 Citroë C3 Pluriel BMW Z4.5i Audi TT.8T 80 Asto Marti Vaquish Betley Cotietal GT Ferrari Ezo Reault Sceic.9 dci Volkswage Toura.9 TDI 4. Résumé des doées Descriptive Statistics N Miimum Maximum Mea Std. Deviatio Cylidrée 4 698 5998 7.54 56.445 Puissace 4 5 660 06.67 55.7 Vitesse 4 35 350 4.7 56.57 Poids 4 730 385 486.58 387.507 Largeur 4 55 650 838.4 0.84 Logueur 4 500 5038 477.83 58.497 Formule utilisée pour l écart-type : s x x ( i ) i 8 7 Lad Rover Defeder Lad Rover Discovery Nissa X-Trail. dci
Tbl Tableau des corrélatios Cylidrée Puissace Vitesse Poids Largeur Logueur Cylidrée.000 0.954 0.885 0.69 0.706 0.664 Puissace 0.954.000 0.934 0.59 0.730 0.57 Vitesse 0.885 0.934.000 0.466 0.69 0.578 Poids 0.69 0.59 0.466.000 0.477 0.795 Largeur 0.706 0.730 0.69 0.477.000 0.59 Logueur 0.664 0.57 0.578 0.795 0.59.000 Toutes les corrélatios sot positives. 5. Le uage de poits associé aux doées X p X X p x g i x i x pi i SMART x i 0 x... x p g X FERRARI X Toutes les corrélatios sot sigificatives au risque 5% ( R / ) 9 N = {x,, x i,, x } = Nuage de poits associé aux doées Cetre de gravité du uage N : g = x x i i 0 6. Iertie totale du uage de poits 7. Réductio des doées X p X X p g i x i x pi x i SMART 0 x... x p g Iertie totale = I(N, g) = X d (xi,g) i ( x x ) ( x x ) p p p ji j ji j j i j j i j FERRARI X Pour eutraliser le problème des uités o remplace les doées d origie par les doées cetrées-réduites : X X X x X x p p p p de moyee 0 et d écart-type.
Les doées cetrées-réduites (SPAD) Case Summaries MODÈLE Zscore: Cylidrée Zscore: Puissace Zscore: Vitesse Zscore: Poids Zscore: Largeur Zscore: Logueur Citroë C. Base -.054 -.935 -.00 -.43 -.8 -.05 Smart Fortwo Coupé -.335 -.993 -.409 -.95 -.464-3.057 3 Mii.6 70 -.74 -.35.058 -.70 -.67 -.3 4 Nissa Micra. 65 -.978 -.90 -.073 -.346 -.808 -.968 5 Reault Clio 3.0 V6.47.30.535 -.3 -.9 -.80 6 AudiA39TDI A3.9 -.545 -.653 -.490 -.494 -.33 -.9 7 8 9 0 Peugeot 307.4 HDI 70 -.873 -.878 -.967 -.794 -.48 -.30 Peugeot 407 3.0 V6 BVA.47.08.53.396 -.4.685 Mercedes Classe C 70 CDI -.05 -.35.70.93 -.500.430 BMW 530d.78.073.535.80.034.968 Jaguar S-Type.7 V6 Bi-Turbo -.00.00.70.608 -.09.079 BMW 745i.05.8.64.989.88.9 3 Mercedes Classe S 400 CDI.80.34.64.06.48.307 4 Citroë C3 Pluriel.6i -.749 -.6 -.55 -.799 -.67 -.59 5 BMWZ45i.5i -.5 -.094.359 -.585 -.60 -.3 5 6 7 8 9 0 3 4 Total Mea Std. Deviatio Audi TT.8T 80 -.6 -.7.35 -.533 -.337 -.407 Asto Marti Vaquish.8.67.64.899.383.666 Betley Cotietal GT.60.69.86.38.360.905 Ferrari Ezo.60.9.39 -.34 3.675.76 Reault Sceic.9 dci 0 -.56 -.557 -.47 -.46 -.5 -.03 Volkswage Toura.9 TDI 05 -.545 -.653 -.64.09 -.0.95 Lad Rover Defeder Td5 -.50 -.544 -.409.538 -.9 -.679 Lad Rover Discovery Td5 -.50 -.44 -.00.777.59.735 NissaXTraildCi X-Trail. -.355 -.454 -.64.086 -.33.305.000.000.000.000.000.000.000.000.000.000.000 3.000 Outlier si valeur > 8. Le uage de poits associé aux doées réduites X i x i X p X p x pi X i 0 0 Moyee X Variace FERRARI 0 SMART X N = {x,, x i,, x } Cetre de gravité : g =0 0, Iertie totale : I(N, 0) = p 4 9. Premier axe pricipal Premier axe pricipal xi X u p y i 0 X X p xi 0 y i X X Objectif : O cherche l axe passat le mieux possible au milieu du uage N. O cherche h à miimiser i i l iertie du uage N par rapport tàl l axe : X Objectif : O cherche l axe d allogemet du uage N. O cherche h à maximiser i l iertie du uage N projeté jtésur l axe : I(N, ) d (xi, yi ) i 5 I( y,..., y, 0) d (yi, 0) i 6
Les objectifs et sot atteits simultaémet De : o déduit : i X X p x i y i 0 i X d (x,0) d (y,0) d (x, y ) i d (x i,0) d (y i,0) d (x i, y i ) i Iertie totale = p = Iertie expliquée par + Iertie résiduelle Maximiser Miimiser 7 i i i Résultats L axe passe par le cetre de gravité 0 du uage de poits N. L axe est egedré par le vecteur ormé u, vecteur propre p de la matrice des corrélatios R associé à la plus grade valeur propre. L iertie expliquée par l axe est égal à. La part d iertie expliquée par le premier axe pricipal est égal à /p. 8 Résultat SPAD Tableau des valeurs propres Numéro Valeur Pourcetage Pourcetage propre cumulé 4.4343 73.5 73.5 0.8534 4. 87.74 3 0.4357 7.6 95.0 4 0.359 393 3.93 98.9494 5 0.054 0.86 99.79 6 0.04 0. 00.00 Les vecteurs propres Résultat SPAD Libellé de la variable Axe Axe Axe 3 Axe 4 Axe 5 Axe 6 Cylidrée 0.46-0.4 0. -0.3-0.65 0.50 Puissace 0.44-0.38 0.4-0.7-0.09-0.78 Vitesse 0.4-0.37 0.3 0.4 0.57 0.3 Poids 0.36 0.6 0. -0.53 0.39 0.0 Largeur 0.38-0. -0.88-0.4 0.5 0.3 Logueur 0.38 0.55-0.09 0.67-0.6-0.9 Normalisatio :.46 +44.44 + +.38 = 9 0
0. Première composate pricipale Y X X p Smart 0 Y () = -4.5 x i u u y i Y (i) X Y est ue ouvelle variable défiie pour chaque idividu i par : Y (i) = logueur algébrique du segmet 0y i = coordoée de y i sur l axe = produit scalaire etre les vecteurs x i et u p = u j jx ji p Y = u j X j j Résultats SPAD Carré de la Idetificateur Distace à l'origie Axe Axe Axe 3 Axe 4 Axe 5 Axe 6 Citroë C. 7.0 -.60-0.5-0.8 0.7-0. -0.03 Smart Fortwo 0.93-4.5 -.67 0.7-0.9-0.03 0.03 Mii670.6 70 93.93 -.38-0.8 037 0.37-0.0505 046 0.46-0.0505 Nissa Micra. 6.6 -.5-0.40-0.7 0. -0.9-0.05 Reault Clio 3.0 V6.6 0.00-0.9 0.39-0.7 0.9 0.3 Audi A3.9 TDI.39 -. 0.7-0.7 0.7-0.07 0.06 Peugeot 307.4 HDI 3.43 -.73 0.30-0.4 0.36-0.4-0.09 Peugeot 407 3.0 V6 076 0.76 055 0.55 05 0.5 06 0.6 034 0.34 000 0.00-0.0 00 Mercedes Classe C 70 0.68 0.08 0.48 0.53 0.37 0. 0. BMW 530d.40 0.84 0.46 0.6 0.68 0.05 0.03 Jaguar S-Type.7 V6.68 0.7 0.90 0. 0.54 0.0-0.3 BMW 745i 5..3 0.6 0.40 0.6-0.36-0.09 Mercedes Classe S 400 566 5.66 7.7 08 0.8-0.48 048 04 0.4 006 0.06 06 0.6 Citroë C3 Pluriel.6i.7 -.6-0. 0.0 0.8-0.0-0.03 BMW Z4.5i 0.70-0.40-0.60 0.0 0.34 0.3 0.4 Audi TT.8T 80.08-0.75-0.46 0.3 0.33 0.4-0.07 Asto Marti Vaquish.6 3.6-0.64.0-0.0-0.39 0.3 Betley Cotietal GT 0.3 46 4.6 006 0.06 49.49-0.83 083 04 0.4-0.3 03 Ferrari Ezo 34.4 4.95 -.58 -.8 0. -0.07-0.0 Reault Sceic.9 dci 0.93-0.84 0.38-0.5 0. 0.08-0.0 Volkswage Toura.9 TDI.3-0.80 0.7-0.4 0.3 0.00-0.0 Lad Rover Defeder 3.4 -.07 0.75-0.8 -.8-0.3 0.0 Lad Rover Discovery 7.8 0.85.9 -.5 -.00 0.3 0.03 Nissa X-Trail. dci 0.96-0.6 0.7-0.05 0. -0.7-0. DISTO = d (x i, 0) Corrélatios etre les variables et les composates pricipales Propriétés de la première composate pricipale Y Y = u X + u X + + u p X p Corrélatios des variables actives avec les facteurs Libellé de la variable Axe Axe Axe 3 Axe 4 Axe 5 Axe 6 Cylidrée 0.96-0.3 0.4-0. -0.5 0.06 Puissace 09 0.9-0.35 035 009 0.09-0.08 008-0.0 00-0.09 009 Vitesse 0.89-0.34 0. 0.0 0.3 0.03 Poids 0.76 0.58 0.5-0.6 0.09 0.00 Largeur 0.80-0. -0.58-0.07 0.03 0.0 Logueur 0.80 0.50-0.06 0.33-0.06-0.0 Moyee de Y = 0 Variace de Y = Iertie expliquée par = Cor(X j, Y ) = u j Das SPSS : Compoet Matrix p cor p j (X, Y ) j p est maximum 3 4