Analyse en Composantes Principales (avec SPAD) Classification Ascendante Hiérarchique

Dimension: px
Commencer à balayer dès la page:

Download "Analyse en Composantes Principales (avec SPAD) Classification Ascendante Hiérarchique"

Transcription

1 Analyse en Composantes Principales (avec SPAD) et Classification Ascendante Hiérarchique Michel Tenenhaus 1

2 Peinture représentant un étang (Tombeau de Thèbes, 1400 av. J.-C.) extrait de l Histoire de l Art de Ernst Gombrich 2

3 Visualiser

4 2. Les objectifs de l analyse en composantes principales Décrire un tableau individusvariables : - Résumer le tableau à l aide d un petit nombre de facteurs - Visualiser le positionnement des individus les uns par rapport aux autres - Visualiser les corrélations entre les variables - Interpréter les facteurs 4

5 Visualisation des données F 2 (i) i 1 X 1 X p F 1 F 2 0 F 1 (i) i x 1i x pi F 1i F 2i n Le plan factoriel Cor(X j,f 2 ) X j 0 Cor(X j,f 1 ) Tableau Facteurs centrés-réduits éd des données résumant les données p Fh 1 u j hjx j (non corrélés entre eux) La carte des variables 5

6 3. Un exemple de positionnement de produits Caractéristiques de 24 modèles de voiture (Source : L argus de l automobile, 2004) Mdèl Modèle Cylindrée Puissance Vitesse Poids Largeur Longueur (cm 3 ) (ch) (km/h) (kg) (mm) (mm) Citroën C2 1.1 Base Smart Fortwo Coupé Mini Nissan Micra Renault Clio 3.0 V Audi A3 1.9 TDI Peugeot HDI Peugeot V6 BVA Mercedes Classe C 270 CDI BMW 530d Jaguar S-Type27V6Bi-Turbo 2.7 Turbo BMW 745i Mercedes Classe S 400 CDI Citroën C3 Pluriel 1.6i BMWZ425i 2.5i Audi TT 1.8T Aston Martin Vanquish Bentley Continental GT Ferrari Enzo Renault Scenic 1.9 dci Volkswagen Touran 1.9 TDI Land Rover Defender Td Land Rover Discovery Td Nissan X-Trail 2.2 dci

7 Puissance Graphiques en étoile des voitures Longueur Cylindrée Citroën C2 1.1 Smart Fortwo Mini Largeur Vitesse Nissan Micra 1.2 Renault Clio 3.0 V6 Audi A3 1.9 TDI Poids Peugeot HDI 70 Peugeot V6 Mercedes Classe C 270 BMW 530d Jaguar S-Type 2.7 V6 BMW 745i Mercedes Classe S 400 Citroën C3 Pluriel BMW Z4 2.5i Audi TT 1.8T 180 Aston Martin Vanquish Bentley Continental GT Ferrari Enzo Renault Scenic 1.9 dci Volkswagen Touran 1.9 TDI 7 Land Rover Defender Land Rover Discovery Nissan X-Trail 2.2 dci

8 4. Résumé é des données Descriptive Statistics Cylindrée Puissance Vitesse Poids Largeur Longueur N Minimum Maximum Mean Std. Deviation Formule utilisée pour l écart-type : n 1 2 ( i ) 1 i 1 8 s x x n

9 Tableau des corrélations Cylindrée Puissance Vitesse Poids Largeur Longueur Cylindrée Puissance Vitesse Poids Largeur Longueur Toutes les corrélations sont positives. Toutes les corrélations sont significatives au risque 5% ( R 2/ n ) 9

10 5. Le nuage de points associé aux données 1 X 1 X p X p i x 1i x pi x i g n SMART 0 FERRARI X 2 x1... x p g X 1 N={x 1,, x i,, x n } = Nuage de points associé aux données 1 = n Centre de gravité du nuage N : g x i n i1 10

11 6. Inertie totale du nuage de points 1 X 1 X p X p i x 1i x pi x i g n SMART 0 FERRARI X 2 x1... x p g X 1 1 n 2 Inertie totale = I(N, g) = d (x i,g) n i1 1 1 n n p p n p ( xji xj ) ( xji xj ) j i1 j1 j1 n i1 j1 11

12 7. Réduction des données Pour neutraliser le problème des unités on remplace les données d origine par les données centrées-réduites : X X X x X x p p p p de moyenne 0 et d écart-type 1. 12

13 Les données centrées-réduites (SPAD) Total Mean Std. Deviation Case Summaries MODÈLE Zscore: Cylindrée Zscore: Puissance Zscore: Vitesse Zscore: Poids Zscore: Largeur Zscore: Longueur Citroën C2 1.1 Base Smart Fortwo Coupé Mini Nissan Micra Renault Clio 3.0 V Audi A3 1.9 TDI Peugeot HDI Peugeot V6 BVA Mercedes Classe C 270 CDI BMW 530d Jaguar S-Type 2.7 V6 Bi-Turbo BMW 745i Mercedes Classe S 400 CDI Citroën C3 Pluriel 1.6i BMW Z4 2.5i Audi TT 1.8T Aston Martin Vanquish Bentley Continental GT Ferrari Enzo Renault Scenic 1.9 dci Volkswagen Touran 1.9 TDI Land Rover Defender Td Land Rover Discovery Td Nissan X-Trail 2.2 dci Outlier si valeur > 2

14 8. Le nuage de points associé aux données réduites X 1 1 X p X p i x 1i x pi n x pi X i Moyenne X 1 SMART FERRARI X Variance N = {x 1,, x i,, x n } Centre de gravité : g = 0, Inertie totale : I(N, 0) = p 14

15 9. Premier axe principal 1 1 x X i u p 1 0 y i X 2 X 1 Objectif 1 : On cherche l axe 1 passant le mieux possible au milieu du nuage N. On cherche à minimiser l inertie du nuage N par rapport à l axe 1 : I(N 1 n 2, 1 ) d (x i, y i ) n i1 15

16 Premier axe principal 1 1 x X i p 0 y i X 2 X 1 Objectif 2 : On cherche l axe d allongement 1 du nuage N. On cherche à maximiser l inertie du nuage N projeté sur l axe 1 : I( n 2 1 d (y i, 0 ) n i1 1 y,..., y n, 0) 16

17 Les objectifs 1 et 2 sont atteints simultanément X p x i y i 0 1 X 2 X 1 De : on déduit : d 2 (x i,0) d 2 (y i,0) d 2 (x i, y i ) 1 n 1 n n n 2 2 d (xi,0) d (yi,0) i1 n i1 n i1 1 d 2 (x i, y i ) Inertie totale = p = Inertie expliquée par 1 + Inertie résiduelle Maximiser Minimiser 17

18 Résultats t L axe 1 passe par le centre de gravité 0 du nuage de points N. L axe 1 est engendré par le vecteur normé u 1, vecteur propre de la matrice des corrélations R associé à la plus grande valeur propre 1. L inertie expliquée par l axe 1 est égal à 1. La part d inertie expliquée par le premier axe principal 1 est égal à 1 /p. 18

19 Résultat SPAD Tableau des valeurs propres Numéro Valeur Pourcentage Pourcentage propre cumulé

20 Résultat SPAD Les vecteurs propres Libellé de la variable Axe 1 Axe 2 Axe 3 Axe 4 Axe 5 Axe 6 Cylindrée Puissance Vitesse Poids Largeur Longueur Normalisation : = 1 20

21 10. Première composante principale Y 1 X p x i 1 X 1 Smart u 1 0 Y 1 (1) = y i Y 1 (i) X 2 Y 1 est une nouvelle variable définie pour chaque individu i par : Y 1 (i) = longueur algébrique du segment 0y i = coordonnée de y i sur l axe 1 = produit scalaire entre les vecteurs x i et u 1 p = j1 u p 1jx ji Y 1 = j1 u 1 X j j 21

22 Résultats SPAD Carré de la Identificateur Distance à l'origine Axe 1 Axe 2 Axe 3 Axe 4 Axe 5 Axe 6 Citroën C Smart Fortwo Mini Nissan Micra Renault Clio 3.0 V Audi A3 1.9 TDI Peugeot HDI Peugeot V Mercedes Classe C BMW 530d Jaguar S-Type 2.7 V BMW 745i Mercedes Classe S Citroën C3 Pluriel 1.6i BMWZ425i 2.5i Audi TT 1.8T Aston Martin Vanquish Bentley Continental GT Ferrari Enzo Renault Scenic 1.9 dci Volkswagen Touran 1.9 TDI Land Rover Defender Land Rover Discovery Nissan X-Trail 2.2 dci DISTO = d 2 (x i, 0) 22

23 Corrélations entre les variables et les composantes principales Corrélations des variables actives avec les facteurs Libellé de la variable Axe 1 Axe 2 Axe 3 Axe 4 Axe 5 Axe 6 Cylindrée Puissance Vitesse Poids Largeur Longueur Dans SPSS : Component Matrix 23

24 Propriétés de la première composante principale i Y 1 Y 1 = u 11 X 1 + u 12 X u 1p X p Moyenne de Y 1 = 0 Variance de Y 1 = Inertie expliquée par 1 = 1 Cor(X j, Y 1 ) = 1 u 1j 1 p p j1 cor 2 (X j, Y ) 1 p 1 est maximum 24

25 Qualité de la première composante principale Inertie totale = 6 Inertie expliquée par le premier axe principal p = = Part d inertie expliquée par le premier axe principal i : p La première composante principale explique 73,5% de la variance totale. 25

26 11. Deuxième axe principal 2 2 x i Y 2 (i) a i 0 Y 1 (i) 1 26

27 Résultats t On recherche le deuxième axe principal 2 orthogonal à 1 et passant le mieux possible au milieu du nuage. Il passe par le centre de gravité 0 du nuage de points et est engendré par le vecteur normé u 2, vecteur propre de la matrice des corrélations R associé à la deuxième plus grande valeur propre 2. La deuxième composante principale Y 2 est définie par projection des points sur le deuxième axe principal. La deuxième composante principale Y 2 est centrée, de variance 2, et non corrélée à la première composante principale Y 1. 27

28 Exemple Auto 2004 : Le premier plan factoriel 3 Familiales (14,2%) 2 Land Rover Discovery Petites Voitures Nissan X-Trail 2.2 d Jaguar S-Type 2.7 V6 Volkswagen Touran Land Rover Defender Peugeot V6 Mercedes Classe S Renault Scenic 1.9 d Mercedes Classe C BMW 745i Peugeot HDI BMW 530d Bentley Continental Grosses Audi A3 1.9 TDI Citroën C3 Pluriel Voitures Nissan Micra 1.2 Audi TT 1.8T 180 Aston Martin Vanquish (73,5%) Citroën C2 1.1 BMW Z4 2.5i Mini Renault Clio 3.0 V6 Facteu ur 2-2 Smart Fortwo Coupé -3 Le plan explique 87,7% de la variance totale -2 Facteur Sportives 1 Ferrari Enzo

29 La carte des variables 1.0 poids.5 longueur Compon nent 2 [Co or(x j, F 2 )] 0.0 largeur cylindrée -.5 Vitesse Puissance Component 1 [Cor(X 1, F 1 )] Longueur d une flèche = R(X j ; F 1, F 2 ) 29

30 Qualité globale de l analyse Inertie totale = variance totale = p Part de variance expliquée par la première composante principale = Part de variance expliquée par la deuxième composante principale = 1 p 2 Part de variance expliquée par les deux premières composantes principales i = p p 1 2 Et ainsi de suite pour les autres dimensions... 30

31 12. Le biplot Les échelles doivent être identiques sur les deux axes. Le cercle des variables doit être un cercle. 31

32 Interprétation du biplot La répartition des projections des individus i sur l axe variable X j reflète les valeurs x ij Les coordonnées des individus i sont les valeurs des composantes principales : [Y 1 (i), Y 2 (i)]. Les coordonnées des variables X j sont les vecteurs propres multipliés par une certaine constante, par exemple 2 : (2u 1j, 2u 2j ). 32

33 Justification : la formule de reconstitution u 2 Y 2 (i) 0 x i a i Y 1 (i) u 1 De on déduit x i a i = Y 1 (i)u 1 + Y 2 (i)u 2 1 x ij Y 1 1( (i)u 1j + Y 2 (i)u () 2j = Y2 () i u2 Y () 1 i u j, ix, j j = u u Coordonnée de la projection de l individu i sur l axe variable X j j j 2 2 1j 2 j 33

34 Justification de la lecture du bi-plot Axe 2 y 2i i u 2j X j A ij 0 y 1i u 1j Axe 1 0 A i, X / u u ij 2 2 j 1 j 2 j ( yu yu )/ u u x / u u i 1j 2i 2 j 1j 2 j ij 1j 2 j 34

35 13. Exemple des races canines Race Taille Poids Vitesse Intell. Affect. Agress. Fonction 1 Beauceron TA++ PO+ V++ INT+ AF+ AG+ Utilité Basset Berger-Allemand Boxer Bull-Dog TA- TA++ TA+ TA- PO- PO+ PO+ PO- V- V++ V+ V- INT- INT++ INT+ INT+ AF- AF+ AF+ AF+ AG+ AG+ AG+ AG- Chasse Utilité Compagnie Compagnie g Bull-Mastiff Caniche Chihuahua Cocker TA++ TA- TA- TA+ PO++ PO- PO- PO- V- V+ V- V- INT++ INT++ INT- INT+ AF- AF+ AF+ AF+ AG+ AG- AG- AG+ pg Utilité Compagnie Compagnie Compagnie Colley Dalmatien Doberman Dogue Allemand TA++ TA+ TA++ TA++ PO+ PO+ PO+ PO++ V++ V+ V++ V++ INT+ INT+ INT++ INT- AF+ AF+ AF- AF- AG- AG- AG+ AG+ pg Compagnie Compagnie Utilité Utilité Dogue Allemand Epagneul Breton Epagneul Français Fox-Hound Fox-Terrier TA++ TA+ TA++ TA++ TA- PO++ PO+ PO+ PO+ PO- V++ V+ V+ V++ V+ INT INT++ INT+ INT- INT+ AF AF+ AF- AF- AF+ AG+ AG- AG- AG+ AG+ Utilité Chasse Chasse Chasse Compagnie Fox-Terrier Grd Bleu de Gascogne Labrador Lévrier Mastiff TA- TA++ TA+ TA++ TA++ PO- PO+ PO+ PO+ PO++ V+ V+ V+ V++ V INT+ INT- INT+ INT- INT AF+ AF- AF+ AF- AF AG+ AG+ AG- AG- AG+ Compagnie Chasse Chasse Chasse Utilité Mastiff Pékinois Pointer Saint-Bernard Setter TA++ TA- TA++ TA++ TA++ PO++ PO- PO+ PO++ PO+ V- V- V++ V- V++ INT- INT- INT++ INT+ INT+ AF- AF+ AF- AF- AF AG+ AG- AG- AG+ AG Utilité Compagnie Chasse Utilité Chasse Setter Teckel Terre-Neuve TA++ TA- TA++ PO+ PO- PO++ V++ V- V- INT+ INT+ INT+ AF- AF+ AF- AG- AG- AG- Chasse Compagnie Utilité

36 Le tableau disjonctif complet Race T- T+ T++ P- P+ P++ V- V+ V++ I- I+ I++ Af- Af+ Ag- Ag+ Compagnie Chasse Utilité Beauceron Basset Berger all Boxer Bull-dog Bull Mastiff Caniche Chihuahua Cocker Colley Dalmatien Doberman Dogue all Epagneul br Epagneul pg fr Fox-Hound Fox-Terrier Grd Bl de G Labrador Lévrier Mastiff Pékinois Pointer St-Bernard Setter Teckel Terre neuve x ijl = 1 si il individu id i possède la modalité liél de la variable j = 0 sinon 36

37 ACP du tableau disjonctif complet 37

38 Total Mean Std. Deviation 14. Utilisation de SPSS Les données centrées-réduites réduites (SPSS) Case Summaries MODÈLE Zscore: Cylindrée Zscore: Puissance Zscore: Vitesse Zscore: Poids Zscore: Largeur Zscore: Longueur Citroën C2 1.1 Base Smart Fortwo Coupé Mini Nissan Micra Renault Clio 3.0 V Audi A3 1.9 TDI Peugeot HDI Peugeot V6 BVA Mercedes Classe C 270 CDI BMW 530d Jaguar S-Type 2.7 V6 Bi-Turbo BMW 745i Mercedes Classe S 400 CDI Citroën C3 Pluriel 1.6i BMW Z4 2.5i Audi TT 1.8T Aston Martin Vanquish Bentley Continental GT Ferrari Enzo Renault Scenic 1.9 dci Volkswagen Touran 1.9 TDI Land Rover Defender Td Land Rover Discovery Td Nissan X-Trail 2.2 dci Outlier si valeur > 2

39 Résultats SPSS : Les facteurs MODÈLE Facteur 1 Facteur 2 Facteur 3 Facteur 4 Facteur 5 Facteur 6 1 Citroën C2 1.1 Base Smart Fortwo Coupé Mini Nissan Micra Renault Clio 3.0 V Audi A3 1.9 TDI Peugeot HDI Peugeot V6 BVA Mercedes Classe C 270 CDI BMW 530d Jaguar S-Type 2.7 V6 Bi-Turbo BMW 745i Mercedes Classe S 400 CDI Citroën C3 Pluriel 1.6i BMW Z4 2.5i Audi TT 1.8T Aston Martin Vanquish Bentley Continental GT Ferrari Enzo Renault Scenic 1.9 dci Volkswagen Touran 19TDI Land Rover Defender Td Land Rover Discovery Td Nissan X-Trail 2.2 dci Total Mean Std. Deviation

40 Propriétés é des facteurs de SPSS Lien entre les composantes principales et les facteurs de SPSS Les facteurs de SPSS sont les composantes principales p réduites. F h 1 n Y n1 h h Calcul des facteurs de SPSS en fonction des variables (X j ) SPSS p h hj j SPSS j1 F w (X ) w h 1 h u h Cylindrée Puissance Vitesse Poids Largeur Longueur Tableau des w h Component Score Coefficient Matrix Component Extraction Method: Principal Component Analysis. Component Scores. 40

41 15. Construction ti d une typologie des individus id Rechercher des groupes d individus homogènes dans la population : - Deux individus appartenant au même groupe sont proches. - Deux individus appartenant à des groupes différents sont éloignés. Construire une partition de la population en groupes homogènes et différents les uns des autres. On réalise la typologie au choix (1) sur les données centrées-réduites, (2) sur les premières composantes principales (SPAD), (3) sur les premières composantes principales réduites (les facteurs de SPSS). 41

42 Construction ti d une typologie des individus idiid o o o o o o o o o + o o + o o o o o o o o o o Fabrication de groupes à partir de données uniformément réparties Données structurées en trois groupes 42

43 Dendrogramme groups g p Choosing the cutting level l x x x Definition of the clusters 43

44 Dendrogramme indice (1) (3) (4) (2) (5) Individu d origine 44

45 Classification ascendante hiérarchique (Méthode de Ward) X 1 X p g 2 g 1 X 2 g 3 X Distance de Ward : D(G i, G j ) = nn i j 2 d(g,g) i j (n n ) i j n i = effectif de la classe G i 45

46 Tableau des distances entre les voitures Proximity Matrix Case 1:Citroën C2 1.1 Base 2S 2:Smart tfortwo Coupé 3:Mini :Nissan Micra :Land Rover Discovery 24:Nissan X-Trail 2.2 d This is a dissimilarity matrix Squared Euclidean Distance 23:Land 1:Citroën C2 2:Smart 4:Nissan Rover 24:Nissan 1.1 Base Fortwo Coupé 3:Mini Micra Discovery X-Trail 2.2 d p 2 2 k l jk jl j d(x,x) (x x) D (Citroën C2, 1 1 Nissan Micra) = Ward (11)

47 Classification i Ascendante Hiérarchique Étape initiale iti Chaque individu forme une classe. On regroupe les deux individus les plus proches. Étape courante A chaque étape, on regroupe les deux classes G i et G j minimisant le critère de Ward D(G i, G j ). 47

48 H I E R A R C H I C A L C L U S T E R A N A L Y S I S Dendrogram using Ward Method Rescaled Distance Cluster Combine C A S E Label Num Citroën C2 1.1 Base 1 Nissan Micra Peugeot HDI 7 Citroën C3 Pluriel 1 14 BMW Z4 2.5i 15 Audi TT 1.8T Renault Clio 3.0 V6 5 Mini i Volkswagen Touran Nissan X-Trail 2.2 d 24 Audi A3 1.9 TDI 6 Renault Scenic 1.9 d 20 Land Rover Defender 22 Smart Fortwo Coupé 2 Peugeot V6 B BMW 530d 10 Jaguar S-Type 2.7 V6 11 Mercedes Classe C 27 9 BMW 745i 12 Mercedes Classe S Land Rover Discovery Aston Martin Vanquis 17 Bentley Continental 18 Ferrari Enzo 19 48

49 Construction de la classification hiérarchique sur les données centrées-réduites par SPSS Numéro Ainé Benjamin Nb d'éléments terminaux du noeud Distance de Ward Somme des indices de niveau

50 Interprétation de la typologie G45 (14) D(G 2,G 42 ) = Toute la population (G47) D(G 45,G 46 ) = G46 (10) D(G 43,G 44 ) = G2 (1) G42 (13) G43 (7) G44 (3) D(G 23,G 40 ) = D(G 2,G 42 ) = G23 (1) G40 (6) G19 (1) G38 (2) 50

51 Décomposition de la somme des carrés totale X 1 X p g 2 g 1 g g 3 X 2 n K K i k k i k i1 k1 k1 ig k d (x,g) n d (g,g) d (x,g ) Somme des carrés Somme des carrés Somme des carrés 51 totale = (n-1)p = interclasses + intraclasses

52 Coefficient : Somme des carrés intra-classes de la typologie en K classes Distance de Ward(1,4) Stage Agglomeration Schedule Résultats SPSS : Somme des carrés intra-classes Stage Cluster First Qualité de la typologie Cluster Combined Appears Cluster 1 Cluster 2 Coefficients Cluster 1 Cluster 2 Next Stage en K classes : (138 - Coeff[n-K])/ Qualité de la typologie en 2 classes : ( )/138 = Somme des carrés intra-classes pour la typologie en K=2 classes 22 Somme des carrés 23 totale = p(n-1) Groupe contenant 1 52

53 Qualité des typologies Nombre de classes Somme des carrés intraclasses Somme des carrés interclasses % de Somme des carrés expliquée Distance de Ward distance de Ward entre les groupes fusionnés = (S.C. Intra) = (S.C. Inter) 53

54 Qualité de la typologie en K classes La somme des carrés expliquée par la typologie en K classes est égale à la somme des carrés interclasses de la typologie en K classes. La qualité de la typologie est mesurée par la proportion de la somme des carrés totale expliquée par la typologie. 54

55 Choix du nombre de groupes La typologie en 5 groupes explique 81,27 % de la S.C. totale Rescaled Distance Cluster Combine C A S E Label Num Citroën C2 1.1 Base 1 Nissan Micra Peugeot HDI 7 Citroën C3 Pluriel 1 14 BMW Z4 2.5i 15 Audi TT 1.8T Renault Clio 3.0 V6 5 G42 Mini Volkswagen Touran Nissan X-Trail 2.2 d 24 Audi A3 1.9 TDI 6 Renault Scenic 1.9 d 20 Land Rover Defender 22 Smart Fortwo Coupé 2 G2 Peugeot V6 B 8 BMW 530d 10 Jaguar S-Type 2.7 V6 11 Mercedes Classe C 27 9 G43 BMW 745i 12 Mercedes Classe S Land Rover Discovery 23 Aston Martin Vanquis 17 G44 Bentley Continental 18 Ferrari Enzo 19 G19 55

56 Premier plan factoriel et typologie 3 2 Land Rover Discovery Jaguar S-Type 2.7 V6 1 Nissan X-Trail 2.2 d Mercedes Classe S VW Touran Peugeot V6 BMW 745i Land Rover Defender Renault Scenic BMW 530d Mercedes Classe C Peugeot 307 Audi A Citroën C3-1 Nissan Micra Audi TT 1.8T Citroën C2 BMW Z4 2.5i Mini Renault Clio 3.0 V6 Bentley Continental Aston Martin Vanquish Facte eur Smart Fortwo Coupé Ferrari Enzo Facteur 1 56

57 Interprétation des classes Report Ward Method Cylindrée Puissance Vitesse Poids Largeur Longueur 1 Mean N Mean N Mean N Mean N Mean N Total Mean N

58 16. C.A.H. des variables Les données de Kendall 48 candidats à un certain poste sont évalués sur 15 variables : (1) Form of letter of application i (9) Experience (2) Appearance (10) Drive (3) Academic ability (11) Ambition (4) Likeability (12) Grasp (5) Self-confidence (13) Potential (6) Lucidity (14) Keeness to join (7) Honesty (15) Suitability (8) Salesmanship 58

59 1 2 3 Case Summaries X1 X2 X3 X4 X5 X6 X7 X8 X9 X10 X11 X12 X13 X14 X

60 Tableau des corrélations Correlation Matrix Correlation X1 X2 X3 X4 X5 X6 X7 X8 X9 X10 X11 X12 X13 X14 X15 X X X X X X X X X X X X X X X One of the questions of interest here is how the variables cluster, in the sense that some of the qualities may be correlated or confused in the judge s mind. (There was no purpose in clustering the candidates - only one was to be chosen). 60

61 Classification Ascendante Hiérarchique des variables Méthode des plus proches voisins A chaque étape, on fusionne les deux groupes G i et G j maximisant : Max Cor( X, X ) X G, X G a i b j On fusionne G2 et G3. a b G1 o o o o o G G3 61

62 Classification Ascendante Hiérarchique des variables H I E R A R C H I C A L C L U S T E R A N A L Y S I S Dendrogram using Single Linkage (VOISINS LES PLUS PROCHES) Rescaled Distance Cluster Combine C A S E Label Num X6 6 X12 12 X13 13 X8 8 X11 11 X5 5 X10 10 X9 9 X15 15 X4 4 X14 14 X7 7 X1 1 X2 2 X3 3 62

63 Classification Ascendante Hiérarchique des variables Méthode des voisins les plus éloignés A chaque étape, on fusionne les deux groupes G i et G j maximisant : Min Cor( X, X ) X G, X G a i b j On fusionne G1 et G2. a b G1 o o o o o G G3 63

64 Classification Ascendante Hiérarchique des variables H I E R A R C H I C A L C L U S T E R A N A L Y S I S Dendrogram using Complete Linkage (VOISINS LES PLUS ELOIGNES) Rescaled Distance Cluster Combine C A S E Label Num X6 6 X12 12 X8 8 X11 11 X5 5 X10 10 X13 13 X2 2 X4 4 X14 14 X7 7 X9 9 X15 15 X1 1 X3 3 64

65 Bloc 1 Correlation Matrix Correlation X2 X5 X6 X8 X10 X11 X12 X13 X X X X X X X X Les corrélations sont toutes positives. 65

66 Bloc 2 Correlation Matrix X4 X7 X14 Correlation X4 X7 X Bloc 3 Correlation Matrix X1 X9 X15 Correlation X1 X9 X

67 Interprétation des blocs Bloc 1 : Qualités humaines favorables au poste Appearance, Self-confidence, Lucidity, Salesmanship, Drive, Ambition, Grasp, Potential Bloc 2 : Qualités de franchise et de communication Likeability, Honesty, Keenness to join Bloc 3 : Expérience Form of letter of application, Experience, Suitability Bloc 4 : Diplôme Academic ability 67

La classification automatique de données quantitatives

La classification automatique de données quantitatives La classification automatique de données quantitatives 1 Introduction Parmi les méthodes de statistique exploratoire multidimensionnelle, dont l objectif est d extraire d une masse de données des informations

Plus en détail

ACP Voitures 1- Méthode

ACP Voitures 1- Méthode acp=princomp(voit,cor=t) ACP Voitures 1- Méthode Call: princomp(x = voit, cor = T) Standard deviations: Comp.1 Comp.2 Comp.3 Comp.4 Comp.5 Comp.6 2.1577815 0.9566721 0.4903373 0.3204833 0.2542759 0.1447788

Plus en détail

ESIEA PARIS 2010-2011

ESIEA PARIS 2010-2011 ESIEA PARIS 00-0 Exame MAT 50 DATA MINING Vedredi 6 Novembre 00 Première Partie : 5 miutes Eseigat resposable : Frédéric Bertrad Remarque importat : les questios de ce questioaire sot posées das le cotexte

Plus en détail

L ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ

L ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ L ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ INTRODUCTION Données : n individus observés sur p variables quantitatives. L A.C.P. permet d eplorer les liaisons entre variables et

Plus en détail

Analyse en Composantes Principales

Analyse en Composantes Principales Analyse en Composantes Principales Anne B Dufour Octobre 2013 Anne B Dufour () Analyse en Composantes Principales Octobre 2013 1 / 36 Introduction Introduction Soit X un tableau contenant p variables mesurées

Plus en détail

01-2014 Brochure ALD ELECTRIC PART OF ALD NEWMOBILITY

01-2014 Brochure ALD ELECTRIC PART OF ALD NEWMOBILITY 01-2014 Brochure ALD ELECTRIC PART OF ALD NEWMOBILITY 1 Brochure ALD electric INTRODUCTION Notre offre ALD electric se compose d une gamme très complète de véhicules électriques comprenant des hybrides

Plus en détail

Stéphane Tufféry DATA MINING & STATISTIQUE DÉCISIONNELLE. 04/04/2008 Stéphane Tufféry - Data Mining - http://data.mining.free.fr

Stéphane Tufféry DATA MINING & STATISTIQUE DÉCISIONNELLE. 04/04/2008 Stéphane Tufféry - Data Mining - http://data.mining.free.fr Stéphane Tufféry DATA MINING & STATISTIQUE DÉCISIONNELLE 1 Plan du cours Qu est-ce que le data mining? A quoi sert le data mining? Les 2 grandes familles de techniques Le déroulement d un projet de data

Plus en détail

Objectifs. Clustering. Principe. Applications. Applications. Cartes de crédits. Remarques. Biologie, Génomique

Objectifs. Clustering. Principe. Applications. Applications. Cartes de crédits. Remarques. Biologie, Génomique Objectifs Clustering On ne sait pas ce qu on veut trouver : on laisse l algorithme nous proposer un modèle. On pense qu il existe des similarités entre les exemples. Qui se ressemble s assemble p. /55

Plus en détail

ATELIER SOLUTION. Acheter ou louer? Réforme 2006 de la fiscalité applicable aux véhicules. Avec la collaboration de P.1

ATELIER SOLUTION. Acheter ou louer? Réforme 2006 de la fiscalité applicable aux véhicules. Avec la collaboration de P.1 ATELIER SOLUTION Acheter ou louer? Réforme 2006 de la fiscalité applicable aux véhicules Avec la collaboration de P.1 Le marché du véhicule d entreprise P.2 La proportion d'entreprises qui financent au

Plus en détail

Marché de l'automobile - Automobile - Type de carrosserie - Modèle d'automobile

Marché de l'automobile - Automobile - Type de carrosserie - Modèle d'automobile Le marché automobile est fréquemment analysé sous forme de segments ou catégories de voitures, qui indiquent le positionnement de chaque modèle sur le marché. Catégories : Marché de l'automobile - Automobile

Plus en détail

L'analyse des données à l usage des non mathématiciens

L'analyse des données à l usage des non mathématiciens Montpellier L'analyse des données à l usage des non mathématiciens 2 ème Partie: L'analyse en composantes principales AGRO.M - INRA - Formation Permanente Janvier 2006 André Bouchier Analyses multivariés.

Plus en détail

Introduction à l approche bootstrap

Introduction à l approche bootstrap Introduction à l approche bootstrap Irène Buvat U494 INSERM buvat@imedjussieufr 25 septembre 2000 Introduction à l approche bootstrap - Irène Buvat - 21/9/00-1 Plan du cours Qu est-ce que le bootstrap?

Plus en détail

PLAN. Ricco Rakotomalala Tutoriels Tanagra - http://tutoriels-data-mining.blogspot.fr/ 2

PLAN. Ricco Rakotomalala Tutoriels Tanagra - http://tutoriels-data-mining.blogspot.fr/ 2 Apprentissage non-supervisé ou apprentissage multi-supervisé? Ricco RAKOTOMALALA Tutoriels Tanagra - http://tutoriels-data-mining.blogspot.fr/ PLAN. Classification automatique, typologie, etc.. Interprétation

Plus en détail

2 nd semestre. Synthèse de l étude D3 Parcours Analyse de la fidélité des clients par marque. En partenariat avec

2 nd semestre. Synthèse de l étude D3 Parcours Analyse de la fidélité des clients par marque. En partenariat avec 2 nd semestre 2014 Synthèse de l étude D3 Parcours Analyse de la fidélité des clients par marque En partenariat avec Note de synthèse 1 +33 6 87 70 31 12 1. Cadre général L étude D3 Parcours est réalisée

Plus en détail

INTRODUCTION À L ANALYSE FACTORIELLE DES CORRESPONDANCES

INTRODUCTION À L ANALYSE FACTORIELLE DES CORRESPONDANCES INTRODUCTION À L ANALYSE FACTORIELLE DES CORRESPONDANCES Dominique LAFFLY Maître de Conférences, Université de Pau Laboratoire Société Environnement Territoire UMR 5603 du CNRS et Université de Pau Domaine

Plus en détail

1 Complément sur la projection du nuage des individus

1 Complément sur la projection du nuage des individus TP 0 : Analyse en composantes principales (II) Le but de ce TP est d approfondir nos connaissances concernant l analyse en composantes principales (ACP). Pour cela, on reprend les notations du précédent

Plus en détail

La segmentation à l aide de EG-SAS. A.Bouhia Analyste principal à la Banque Nationale du Canada. Chargé de cours à l UQAM

La segmentation à l aide de EG-SAS. A.Bouhia Analyste principal à la Banque Nationale du Canada. Chargé de cours à l UQAM La segmentation à l aide de EG-SAS A.Bouhia Analyste principal à la Banque Nationale du Canada. Chargé de cours à l UQAM Définition de la segmentation - Au lieu de considérer une population dans son ensemble,

Plus en détail

Enjeux mathématiques et Statistiques du Big Data

Enjeux mathématiques et Statistiques du Big Data Enjeux mathématiques et Statistiques du Big Data Mathilde Mougeot LPMA/Université Paris Diderot, mathilde.mougeot@univ-paris-diderot.fr Mathématique en Mouvements, Paris, IHP, 6 Juin 2015 M. Mougeot (Paris

Plus en détail

Votation populaire du 23 septembre 2012 sur l'imposition des véhicules routiers

Votation populaire du 23 septembre 2012 sur l'imposition des véhicules routiers 1 Conférence de presse de la Direction de la police et des affaires militaires du 04.09.2012 Votation populaire du 23 septembre 2012 sur l'imposition des véhicules routiers Conférence de Hansulrich Kuhn,

Plus en détail

Classification non supervisée

Classification non supervisée AgroParisTech Classification non supervisée E. Lebarbier, T. Mary-Huard Table des matières 1 Introduction 4 2 Méthodes de partitionnement 5 2.1 Mesures de similarité et de dissimilarité, distances.................

Plus en détail

5KNA Productions 2013

5KNA Productions 2013 Une Histoire de l Automobile 5KNA Productions 2013 1769 Le Fardier de Cugnot Chariot propulsé par une chaudière à vapeur. Vitesse: 4 km/h. Autonomie: 15 minutes 1770 Le premier accident Le Fardier, sans

Plus en détail

LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING»

LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING» LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING» Gilbert Saporta Professeur de Statistique Appliquée Conservatoire National des Arts et Métiers Dans leur quasi totalité, les banques et organismes financiers

Plus en détail

La Nissan Leaf 2.0 est élue Grand Prix Auto Environnement

La Nissan Leaf 2.0 est élue Grand Prix Auto Environnement INFORMATION PRESSE Le 22 mai 2013 PRIX AUTO ENVIRONNEMENT MAAF 2013 La Nissan Leaf 2.0 est élue Grand Prix Auto Environnement MAAF Assurances récompense 5 véhicules pour la nouvelle édition du Prix Auto

Plus en détail

"Étude TOPÉO" Le Concept de la voiture low cost en France => Cas concret : la NANO de TATA

Étude TOPÉO Le Concept de la voiture low cost en France => Cas concret : la NANO de TATA "Étude TOPÉO" Le Concept de la voiture low cost en France => Cas concret : la NANO de TATA Étude en Ligne, réalisée par CEGMA TOPO, du 0 au 06 avril 009 Auprès de 360 individus : titulaires du permis de

Plus en détail

Analyse de la variance Comparaison de plusieurs moyennes

Analyse de la variance Comparaison de plusieurs moyennes Analyse de la variance Comparaison de plusieurs moyennes Biostatistique Pr. Nicolas MEYER Laboratoire de Biostatistique et Informatique Médicale Fac. de Médecine de Strasbourg Mars 2011 Plan 1 Introduction

Plus en détail

REVUE DE STATISTIQUE APPLIQUÉE

REVUE DE STATISTIQUE APPLIQUÉE REVUE DE STATISTIQUE APPLIQUÉE H. ABDALLAH G. SAPORTA Mesures de distance entre modalités de variables qualitatives; application à la classification Revue de statistique appliquée, tome 51, n o 2 (2003),

Plus en détail

Introduction. Préambule. Le contexte

Introduction. Préambule. Le contexte Préambule... INTRODUCTION... BREF HISTORIQUE DE L ACP... 4 DOMAINE D'APPLICATION... 5 INTERPRETATIONS GEOMETRIQUES... 6 a - Pour les n individus... 6 b - Pour les p variables... 7 c - Notion d éléments

Plus en détail

Déroulement d un projet en DATA MINING, préparation et analyse des données. Walid AYADI

Déroulement d un projet en DATA MINING, préparation et analyse des données. Walid AYADI 1 Déroulement d un projet en DATA MINING, préparation et analyse des données Walid AYADI 2 Les étapes d un projet Choix du sujet - Définition des objectifs Inventaire des données existantes Collecte, nettoyage

Plus en détail

Akka Technologies au service de la voiture électrique - Cartech.fr

Akka Technologies au service de la voiture électrique - Cartech.fr 1 sur 5 30/08/2010 12:40 508 peugeot Accueil News & blogs Produits Shopping Telecharger forum Cartech Inscription CNET France Forums Infotrafic Environnement Technologies embarquées Concept-car Accessoires

Plus en détail

ISFA 2 année 2002-2003. Les questions sont en grande partie indépendantes. Merci d utiliser l espace imparti pour vos réponses.

ISFA 2 année 2002-2003. Les questions sont en grande partie indépendantes. Merci d utiliser l espace imparti pour vos réponses. On considère la matrice de données : ISFA 2 année 22-23 Les questions sont en grande partie indépendantes Merci d utiliser l espace imparti pour vos réponses > ele JCVGE FM1 GM JCRB FM2 JMLP Paris 61 29

Plus en détail

Séance 11 : Typologies

Séance 11 : Typologies Séance 11 : Typologies Sommaire Proc CLUSTER : Typologie hiérarchique... 3 Proc FASTCLUS : Typologie nodale... 8 Proc MODECLUS : Typologie non paramétrique... 11 - Les phénomènes observés (attitudes, comportements,

Plus en détail

Le baromètre BforBank - Vague 5 - Présentation globale des résultats Thème abordé : L automobile

Le baromètre BforBank - Vague 5 - Présentation globale des résultats Thème abordé : L automobile Le baromètre BforBank - Vague 5 - Présentation globale des résultats Thème abordé : L automobile Présentation du 22 juin 2011 N Projet : BJ7418 A : BforBank & L Express De : OpinionWay OpinionWay, 06/07/2011

Plus en détail

Finanzführerschäin. Maison des jeunes Am Quartier

Finanzführerschäin. Maison des jeunes Am Quartier Finanzführerschäin Maison des jeunes Am Quartier 17 mars 2015 Table des matières 1. Qu est-ce qu une transaction? Les notions de «bien» et «service»... 3 2. Qu est-ce qu une dépense? Les notions de besoins

Plus en détail

Résumé de l étude réalisée par CO 2 logic pour le compte de la STIB

Résumé de l étude réalisée par CO 2 logic pour le compte de la STIB Comparaison des émissions de CO 2 par mode de transport en Région de Bruxelles-Capitale Résumé de l étude réalisée par CO 2 logic pour le compte de la STIB 100% Papier recyclé Janvier 2008 Résumé Déplacer

Plus en détail

LOW COST TOUT INCLUS FIAT PANDA. Moteur: Essence A/C Radio CD Assurance tous risques sans franchise Réservoir plein PRIX / SEMAINE

LOW COST TOUT INCLUS FIAT PANDA. Moteur: Essence A/C Radio CD Assurance tous risques sans franchise Réservoir plein PRIX / SEMAINE LOW COST TOUT INCLUS FIAT PANDA Assurance tous risques sans franchise Réservoir plein 01.01.15-30.06.15 20.09.15 30.06.15 01.07.15-31.07.15 01.08.15-23.08.15 23.08.15-20.09.15 190 240 315 240 LOW COST

Plus en détail

COURS DE DATA MINING 4 : MODELISATION NON-SUPERVISEE CLASSIFICATIONS AUTOMATIQUES

COURS DE DATA MINING 4 : MODELISATION NON-SUPERVISEE CLASSIFICATIONS AUTOMATIQUES COURS DE DATA MINING 4 : MODELISATION NON-SUPERVISEE CLASSIFICATIONS AUTOMATIQUES EPF 4/ 5 ème année - Option Ingénierie d Affaires et de Projets - Finance Bertrand LIAUDET 4 : Modélisation non-supervisée

Plus en détail

Statistique : Résumé de cours et méthodes

Statistique : Résumé de cours et méthodes Statistique : Résumé de cours et méthodes 1 Vocabulaire : Population : c est l ensemble étudié. Individu : c est un élément de la population. Effectif total : c est le nombre total d individus. Caractère

Plus en détail

MAP 553 Apprentissage statistique

MAP 553 Apprentissage statistique MAP 553 Apprentissage statistique Université Paris Sud et Ecole Polytechnique http://www.cmap.polytechnique.fr/~giraud/map553/map553.html PC1 1/39 Apprentissage? 2/39 Apprentissage? L apprentissage au

Plus en détail

Véhicules électriques

Véhicules électriques Véhicules électriques Marc Béranger Véhicules électriques Marc Béranger 15 juin 2012 1 Plan de la présentation Histoire de l automobile Puissance et énergie Stockage d énergie Moteur électrique Vehicle-to-grid

Plus en détail

Extraction d informations stratégiques par Analyse en Composantes Principales

Extraction d informations stratégiques par Analyse en Composantes Principales Extraction d informations stratégiques par Analyse en Composantes Principales Bernard DOUSSET IRIT/ SIG, Université Paul Sabatier, 118 route de Narbonne, 31062 Toulouse cedex 04 dousset@irit.fr 1 Introduction

Plus en détail

Big Data et Graphes : Quelques pistes de recherche

Big Data et Graphes : Quelques pistes de recherche Big Data et Graphes : Quelques pistes de recherche Hamamache Kheddouci Laboratoire d'informatique en Image et Systèmes d'information LIRIS UMR 5205 CNRS/INSA de Lyon/Université Claude Bernard Lyon 1/Université

Plus en détail

Analyses multivariées avec R Commander (via le package FactoMineR) Qu est ce que R? Introduction à R Qu est ce que R?

Analyses multivariées avec R Commander (via le package FactoMineR) Qu est ce que R? Introduction à R Qu est ce que R? Analyses multivariées avec R Commander Analyses multivariées avec R Commander (via le package FactoMineR) Plate-forme de Support en Méthodologie et Calcul Statistique (SMCS) - UCL 1 Introduction à R 2

Plus en détail

Évaluation de la régression bornée

Évaluation de la régression bornée Thierry Foucart UMR 6086, Université de Poitiers, S P 2 M I, bd 3 téléport 2 BP 179, 86960 Futuroscope, Cedex FRANCE Résumé. le modèle linéaire est très fréquemment utilisé en statistique et particulièrement

Plus en détail

Analyse de la vidéo. Chapitre 4.1 - La modélisation pour le suivi d objet. 10 mars 2015. Chapitre 4.1 - La modélisation d objet 1 / 57

Analyse de la vidéo. Chapitre 4.1 - La modélisation pour le suivi d objet. 10 mars 2015. Chapitre 4.1 - La modélisation d objet 1 / 57 Analyse de la vidéo Chapitre 4.1 - La modélisation pour le suivi d objet 10 mars 2015 Chapitre 4.1 - La modélisation d objet 1 / 57 La représentation d objets Plan de la présentation 1 La représentation

Plus en détail

PRIX AUTO ENVIRONNEMENT MAAF 2014

PRIX AUTO ENVIRONNEMENT MAAF 2014 INFORMATION PRESSE Le 4 juin 2014 PRIX AUTO ENVIRONNEMENT MAAF 2014 La PEUGEOT 308 1,2L PURETECH STOP&START élue Grand Prix Auto Environnement Attribution d un Prix Spécial 10 ans pour Toyota pour sa gamme

Plus en détail

Chapitre 2 : Caractéristiques du mouvement d un solide

Chapitre 2 : Caractéristiques du mouvement d un solide Chapitre 2 : Caractéristiques du mouvement d un solide I Rappels : Référentiel : Le mouvement d un corps est décris par rapport à un corps de référence et dépend du choix de ce corps. Ce corps de référence

Plus en détail

Logiciel XLSTAT version 7.0. 40 rue Damrémont 75018 PARIS

Logiciel XLSTAT version 7.0. 40 rue Damrémont 75018 PARIS Logiciel XLSTAT version 7.0 Contact : Addinsoft 40 rue Damrémont 75018 PARIS 2005-2006 Plan Présentation générale du logiciel Statistiques descriptives Histogramme Discrétisation Tableau de contingence

Plus en détail

Statistique Descriptive Multidimensionnelle. (pour les nuls)

Statistique Descriptive Multidimensionnelle. (pour les nuls) Publications de l Institut de Mathématiques de Toulouse Statistique Descriptive Multidimensionnelle (pour les nuls) (version de mai 2010) Alain Baccini Institut de Mathématiques de Toulouse UMR CNRS 5219

Plus en détail

Le No.1 de l économie d énergie pour patinoires.

Le No.1 de l économie d énergie pour patinoires. Le No.1 de l économie d énergie pour patinoires. Partner of REALice system Economie d énergie et une meilleure qualité de glace La 2ème génération améliorée du système REALice bien connu, est livré en

Plus en détail

Collège Avril 2015. Mise en service de l infrastructure de recharge de véhicules électriques sur le département des Hautes-Alpes

Collège Avril 2015. Mise en service de l infrastructure de recharge de véhicules électriques sur le département des Hautes-Alpes Collège Avril 2015 Mise en service de l infrastructure de recharge de véhicules électriques sur le département des Hautes-Alpes Contexte et enjeux Les enjeux du véhicule électrique sont multiples : Réduire

Plus en détail

Scénario: Données bancaires et segmentation de clientèle

Scénario: Données bancaires et segmentation de clientèle Résumé Scénario: Données bancaires et segmentation de clientèle Exploration de données bancaires par des méthodes uni, bi et multidimensionnelles : ACP, AFCM k-means, CAH. 1 Présentation Le travail proposé

Plus en détail

TUBES ET ACCESSOIRES Serrurier A ailettes Construction Canalisation Spéciaux

TUBES ET ACCESSOIRES Serrurier A ailettes Construction Canalisation Spéciaux TUBES ET ACCESSOIRES 47 Serrurier A ailettes Construction Canalisation Spéciaux Possibilité d autres sections sur demande. Les caractéristiques indiquées sont théoriques et non garanties. TUBES 48 TUBES

Plus en détail

Une comparaison de méthodes de discrimination des masses de véhicules automobiles

Une comparaison de méthodes de discrimination des masses de véhicules automobiles p.1/34 Une comparaison de méthodes de discrimination des masses de véhicules automobiles A. Rakotomamonjy, R. Le Riche et D. Gualandris INSA de Rouen / CNRS 1884 et SMS / PSA Enquêtes en clientèle dans

Plus en détail

INF6304 Interfaces Intelligentes

INF6304 Interfaces Intelligentes INF6304 Interfaces Intelligentes filtres collaboratifs 1/42 INF6304 Interfaces Intelligentes Systèmes de recommandations, Approches filtres collaboratifs Michel C. Desmarais Génie informatique et génie

Plus en détail

INNOVATION. HAUTE PERFORMANCE. SÉCURITÉ. HIER. AUJOURD HUI. DEMAIN. www.textar.com

INNOVATION. HAUTE PERFORMANCE. SÉCURITÉ. HIER. AUJOURD HUI. DEMAIN. www.textar.com INNOVATION. HAUTE PERFORMANCE. SÉCURITÉ. HIER. AUJOURD HUI. DEMAIN. www.textar.com TOUT. SAUF DES COMPROMIS. Quand il s agit de technologie de freinage Premium, vous pouvez compter sur Textar. Nous n acceptons

Plus en détail

Le Data Mining au service du Scoring ou notation statistique des emprunteurs!

Le Data Mining au service du Scoring ou notation statistique des emprunteurs! France Le Data Mining au service du Scoring ou notation statistique des emprunteurs! Comme le rappelle la CNIL dans sa délibération n 88-083 du 5 Juillet 1988 portant adoption d une recommandation relative

Plus en détail

Théorie des sondages : cours 5

Théorie des sondages : cours 5 Théorie des sondages : cours 5 Camelia Goga IMB, Université de Bourgogne e-mail : camelia.goga@u-bourgogne.fr Master Besançon-2010 Chapitre 5 : Techniques de redressement 1. poststratification 2. l estimateur

Plus en détail

1 - PRESENTATION GENERALE...

1 - PRESENTATION GENERALE... Contenu PREAMBULE... 2 INTRODUCTION... 2 1 - PRESENTATION GENERALE... 4 Qualité et optimalité... 8 2 - AGREGATION AUTOUR DE CENTRES MOBILES... 9 2.1 LES BASES DE L'ALGORITHME... 10 2.2 TECHNIQUES CONNEXES...

Plus en détail

Initiation à l analyse en composantes principales

Initiation à l analyse en composantes principales Fiche TD avec le logiciel : tdr601 Initiation à l analyse en composantes principales A.B. Dufour & J.R. Lobry Une première approche très intuitive et interactive de l ACP. Centrage et réduction des données.

Plus en détail

Analyse des correspondances avec colonne de référence

Analyse des correspondances avec colonne de référence ADE-4 Analyse des correspondances avec colonne de référence Résumé Quand une table de contingence contient une colonne de poids très élevé, cette colonne peut servir de point de référence. La distribution

Plus en détail

Ricco.Rakotomalala http://eric.univ-lyon2.fr/~ricco/cours

Ricco.Rakotomalala http://eric.univ-lyon2.fr/~ricco/cours Ricco.Rakotomalala http://eric.univ-lyon2.fr/~ricco/cours Références : 1. G. Saporta, «Probabilités, Analyse de données et Statistique», Dunod, 2006 ; partie théorique, pages 155 à 177 ; partie pratique,

Plus en détail

Huiles moteurs pour véhicules légers

Huiles moteurs pour véhicules légers Contact: Huiles moteurs pour véhicules légers FUCHS LUBRIFIANT FRANCE DIVISION AUTO MOTO 81, RUE DE L'INDUSTRIE 92500 RUEIL-MALMAISON TEL. : 01.41.37.42.00 FAX : 01.41.37.42.01 www.fuchs-oil.fr Des huiles

Plus en détail

Module Title: French 4

Module Title: French 4 CORK INSTITUTE OF TECHNOLOGY INSTITIÚID TEICNEOLAÍOCHTA CHORCAÍ Semester 2 Examinations 2010 Module Title: French 4 Module Code: LANG 6020 School: Business Programme Title: Bachelor of Business Stage 2

Plus en détail

données en connaissance et en actions?

données en connaissance et en actions? 1 Partie 2 : Présentation de la plateforme SPSS Modeler : Comment transformer vos données en connaissance et en actions? SPSS Modeler : l atelier de data mining Large gamme de techniques d analyse (algorithmes)

Plus en détail

Consommation de flotte (1989 2012)

Consommation de flotte (1989 2012) Bases et méthodologie de comparaison L Association des importateurs suisses d automobiles «auto-suisse» établit chaque année la consommation moyenne des voitures de tourisme vendues appelée consommation

Plus en détail

DATA MINING - Analyses de données symboliques sur les restaurants

DATA MINING - Analyses de données symboliques sur les restaurants Master 2 Professionnel - Informatique Décisionnelle DATA MINING - Analyses de données symboliques sur les restaurants Etudiants : Enseignant : Vincent RICHARD Edwin DIDAY Seghir SADAOUI SOMMAIRE I Introduction...

Plus en détail

Adaptez-vous aux nouvelles tendances de la distribution automobile

Adaptez-vous aux nouvelles tendances de la distribution automobile Adaptez-vous aux nouvelles tendances de la distribution automobile Les nouvelles tendances de la distribution automobile Le comportement du client Le client est exigeant Le client a conscience de sa valeur

Plus en détail

Programmation linéaire

Programmation linéaire Programmation linéaire DIDIER MAQUIN Ecole Nationale Supérieure d Electricité et de Mécanique Institut National Polytechnique de Lorraine Mathématiques discrètes cours de 2ème année Programmation linéaire

Plus en détail

Etude d un cas industriel : Optimisation de la modélisation de paramètre de production

Etude d un cas industriel : Optimisation de la modélisation de paramètre de production Revue des Sciences et de la Technologie RST- Volume 4 N 1 /janvier 2013 Etude d un cas industriel : Optimisation de la modélisation de paramètre de production A.F. Bernate Lara 1, F. Entzmann 2, F. Yalaoui

Plus en détail

La boucle for La boucle while L utilisation du if else. while (condition) { instruction(s) }

La boucle for La boucle while L utilisation du if else. while (condition) { instruction(s) } VI Initiation à la programmation sous Comme nous l avons constaté tout au long du document, offre de nombreuses fonctionnalités En tant que nouvelles utilisateurs de il vous est désormais PRESQUE possible

Plus en détail

Historique. Architecture. Contribution. Conclusion. Définitions et buts La veille stratégique Le multidimensionnel Les classifications

Historique. Architecture. Contribution. Conclusion. Définitions et buts La veille stratégique Le multidimensionnel Les classifications L intelligence économique outil stratégique pour l entreprise Professeur Bernard DOUSSET dousset@irit.fr http://atlas.irit.fr Institut de Recherche en Informatique de Toulouse (IRIT) Equipe Systèmes d

Plus en détail

CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures)

CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures) CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE Cinquième épreuve d admissibilité STATISTIQUE (durée : cinq heures) Une composition portant sur la statistique. SUJET Cette épreuve est composée d un

Plus en détail

FORMULAIRE DE STATISTIQUES

FORMULAIRE DE STATISTIQUES FORMULAIRE DE STATISTIQUES I. STATISTIQUES DESCRIPTIVES Moyenne arithmétique Remarque: population: m xμ; échantillon: Mx 1 Somme des carrés des écarts "# FR MOYENNE(série) MOYENNE(série) NL GEMIDDELDE(série)

Plus en détail

REMBOURSÉS* REMBOURSÉS * SUR VOS PNEUS TTC TTC. Mer : 24 Température : 30 Remise : 80 E. Jusqu à. Jusqu à

REMBOURSÉS* REMBOURSÉS * SUR VOS PNEUS TTC TTC. Mer : 24 Température : 30 Remise : 80 E. Jusqu à. Jusqu à Mer : 24 Température : 30 Remise : 80 E 80 e Du 21 juin au 24 juillet 2010 REMBOURSÉS* REMBOURSÉS * SUR VOS PNEUS POUR L ACHAT ET LA POSE DE 4 PNEUS TOURISME OU 4X4 ÉTÉ *Voir conditions en page 3. Et en

Plus en détail

Une nouvelle approche de détection de communautés dans les réseaux sociaux

Une nouvelle approche de détection de communautés dans les réseaux sociaux UNIVERSITÉ DU QUÉBEC EN OUTAOUAIS Département d informatique et d ingénierie Une nouvelle approche de détection de communautés dans les réseaux sociaux Mémoire (INF 6021) pour l obtention du grade de Maîtrise

Plus en détail

Individus et informations supplémentaires

Individus et informations supplémentaires ADE-4 Individus et informations supplémentaires Résumé La fiche décrit l usage des individus supplémentaires dans des circonstances variées. En particulier, cette pratique est étendue aux analyses inter

Plus en détail

VISUALISATION DES DISTANCES ENTRE LES CLASSES DE LA CARTE DE KOHONEN POUR LE DEVELOPPEMENT D'UN OUTIL D'ANALYSE ET DE REPRESENTATION DES DONNEES

VISUALISATION DES DISTANCES ENTRE LES CLASSES DE LA CARTE DE KOHONEN POUR LE DEVELOPPEMENT D'UN OUTIL D'ANALYSE ET DE REPRESENTATION DES DONNEES VISUALISATION DES DISTANCES ENTRE LES CLASSES DE LA CARTE DE KOHONEN POUR LE DEVELOPPEMENT D'UN OUTIL D'ANALYSE ET DE REPRESENTATION DES DONNEES Patrick Rousset 1,2 et Christiane Guinot 3 1 CEREQ, Service

Plus en détail

LA PUISSANCE DES MOTEURS. Avez-vous déjà feuilleté le catalogue d un grand constructeur automobile?

LA PUISSANCE DES MOTEURS. Avez-vous déjà feuilleté le catalogue d un grand constructeur automobile? LA PUISSANCE DES MOTEURS Avez-vous déjà feuilleté le catalogue d un grand constructeur automobile? Chaque modèle y est décliné en plusieurs versions, les différences portant essentiellement sur la puissance

Plus en détail

STATISTIQUES. UE Modélisation pour la biologie

STATISTIQUES. UE Modélisation pour la biologie STATISTIQUES UE Modélisation pour la biologie 2011 Cadre Général n individus: 1, 2,..., n Y variable à expliquer : Y = (y 1, y 2,..., y n ), y i R Modèle: Y = Xθ + ε X matrice du plan d expériences θ paramètres

Plus en détail

Cours de méthodes de scoring

Cours de méthodes de scoring UNIVERSITE DE CARTHAGE ECOLE SUPERIEURE DE STATISTIQUE ET D ANALYSE DE L INFORMATION Cours de méthodes de scoring Préparé par Hassen MATHLOUTHI Année universitaire 2013-2014 Cours de méthodes de scoring-

Plus en détail

WWW.ATD-FRANCE.COM BOÎTES DE VITESSES MANUELLES AUTOMATIQUES FRANCE 05 57 68 17 68 PARIS 0 820 250 200

WWW.ATD-FRANCE.COM BOÎTES DE VITESSES MANUELLES AUTOMATIQUES FRANCE 05 57 68 17 68 PARIS 0 820 250 200 WWW.ATD-FRANCE.COM 2013 BOÎTES DE VITESSES MANUELLES AUTOMATIQUES FRANCE 05 57 68 17 68 PARIS 0 820 250 200 1 CHOISIR LE LEADER DU RECONDITIONNEMENT DE BOÎTES DE VITESSES EN FRANCE C'EST S'ASSURER : LA

Plus en détail

Dimensionnement d une roue autonome pour une implantation sur un fauteuil roulant

Dimensionnement d une roue autonome pour une implantation sur un fauteuil roulant Dimensionnement d une roue autonome pour une implantation sur un fauteuil roulant I Présentation I.1 La roue autonome Ez-Wheel SAS est une entreprise française de technologie innovante fondée en 2009.

Plus en détail

L'analyse de données. Polycopié de cours ENSIETA - Réf. : 1463. Arnaud MARTIN

L'analyse de données. Polycopié de cours ENSIETA - Réf. : 1463. Arnaud MARTIN L'analyse de données Polycopié de cours ENSIETA - Réf : 1463 Arnaud MARTIN Septembre 2004 Table des matières 1 Introduction 1 11 Domaines d'application 2 12 Les données 2 13 Les objectifs 3 14 Les méthodes

Plus en détail

Caroline Hurault-Delarue 1, Cécile Chouquet 2, Nicolas Savy 2, Isabelle Lacroix 1, Christine Damase- Michel 1

Caroline Hurault-Delarue 1, Cécile Chouquet 2, Nicolas Savy 2, Isabelle Lacroix 1, Christine Damase- Michel 1 Trajectoires individuelles d'exposition aux psychotropes au cours de la grossesse et partitionnement en fonction du profil d'exposition : utilisation des K-means pour données longitudinales Caroline Hurault-Delarue

Plus en détail

Honda se place en tête de la satisfaction des propriétaires français de nouveaux véhicules pour la troisième année consécutive

Honda se place en tête de la satisfaction des propriétaires français de nouveaux véhicules pour la troisième année consécutive Etude de J.D. Power and Associates en partenariat avec L Automobile Magazine : La satisfaction des propriétaires de véhicules en France diminue considérablement par rapport à 2010 Honda se place en tête

Plus en détail

Big Data et Graphes : Quelques pistes de recherche

Big Data et Graphes : Quelques pistes de recherche Big Data et Graphes : Quelques pistes de recherche Hamamache Kheddouci http://liris.cnrs.fr/hamamache.kheddouci Laboratoire d'informatique en Image et Systèmes d'information LIRIS UMR 5205 CNRS/INSA de

Plus en détail

Introduction au Data-Mining

Introduction au Data-Mining Introduction au Data-Mining Alain Rakotomamonjy - Gilles Gasso. INSA Rouen -Département ASI Laboratoire PSI Introduction au Data-Mining p. 1/25 Data-Mining : Kèkecé? Traduction : Fouille de données. Terme

Plus en détail

FICHE FISCALITE 2014 LA FISCALITÉ AUTOMOBILE : GÉNÉRALITÉS & SPÉCIFICITÉS POUR LES VÉHICULES PARTICULIERS MÉMENTO SUR LA FISCALITÉ AUTOMOBILE.

FICHE FISCALITE 2014 LA FISCALITÉ AUTOMOBILE : GÉNÉRALITÉS & SPÉCIFICITÉS POUR LES VÉHICULES PARTICULIERS MÉMENTO SUR LA FISCALITÉ AUTOMOBILE. FICHE FISCALITE 2014 MÉMENTO SUR LA FISCALITÉ AUTOMOBILE Page 1 SOMMAIRE LES AVANTAGES EN NATURE :... 3 2 modes de calcul :... 3 Mode n 1 : le calcul selon les dépenses au réel :... 3 Mode n 2 : le calcul

Plus en détail

La structure de la base de données et l utilisation de PAST. Musée Royal de l Afrique Centrale (MRAC Tervuren)

La structure de la base de données et l utilisation de PAST. Musée Royal de l Afrique Centrale (MRAC Tervuren) La structure de la base de données et l utilisation de PAST La structure de la base de données données originales SPÉCIMENS Code des spécimens: Identification des spécimens individuels. Dépend du but de

Plus en détail

SECTEUR AUTOMOBILE SUR UNE NOUVELLE VOIE

SECTEUR AUTOMOBILE SUR UNE NOUVELLE VOIE PRODUCTIVITÉ RESPONSABLE ENVIRONNEMENT AUTOMOBILES SECTEUR AUTOMOBILE SUR UNE NOUVELLE VOIE PAR MARK CARDWELL PHOTOS ATLAS COPCO/ISTOCKPHOTO/GEELY Àl heure où les économies mondiales se relèvent de la

Plus en détail

TARIFS DE LOCATION VOITURES

TARIFS DE LOCATION VOITURES TARIFS DE LOCATION VOITURES TABLE DES MATIERES Page. RCA 01 Montants des franchises Franchises pour vol et suppléments pour élimination / réduction de la franchise 01 Franchises pour dommages et suppléments

Plus en détail

Cours 7 : Utilisation de modules sous python

Cours 7 : Utilisation de modules sous python Cours 7 : Utilisation de modules sous python 2013/2014 Utilisation d un module Importer un module Exemple : le module random Importer un module Exemple : le module random Importer un module Un module est

Plus en détail

Exposing a test of homogeneity of chronological series of annual rainfall in a climatic area. with using, if possible, the regional vector Hiez.

Exposing a test of homogeneity of chronological series of annual rainfall in a climatic area. with using, if possible, the regional vector Hiez. Test d homogéné$é Y. BRUNET-MORET Ingénieur hydrologue, Bureau Central Hydrologique Paris RÉSUMÉ Présentation d un test d homogénéi.té spécialement conçu pour vérijier Z homogénéité des suites chronologiques

Plus en détail

24 ème salon TECHNO-CLASSICA ESSEN 2012 le salon mondial des passionnés de l automobile

24 ème salon TECHNO-CLASSICA ESSEN 2012 le salon mondial des passionnés de l automobile 24 ème salon TECHNO-CLASSICA ESSEN 2012 le salon mondial des passionnés de l automobile Le plus grand salon international de voitures classiques se tient du 21* au 25 mars 2012 * 21 mars 2012 : Pré-salon,

Plus en détail

Chapitre 3. Les distributions à deux variables

Chapitre 3. Les distributions à deux variables Chapitre 3. Les distributions à deux variables Jean-François Coeurjolly http://www-ljk.imag.fr/membres/jean-francois.coeurjolly/ Laboratoire Jean Kuntzmann (LJK), Grenoble University 1 Distributions conditionnelles

Plus en détail

Apprentissage Automatique

Apprentissage Automatique Apprentissage Automatique Introduction-I jean-francois.bonastre@univ-avignon.fr www.lia.univ-avignon.fr Définition? (Wikipedia) L'apprentissage automatique (machine-learning en anglais) est un des champs

Plus en détail

Sujet proposé par Yves M. LEROY. Cet examen se compose d un exercice et de deux problèmes. Ces trois parties sont indépendantes.

Sujet proposé par Yves M. LEROY. Cet examen se compose d un exercice et de deux problèmes. Ces trois parties sont indépendantes. Promotion X 004 COURS D ANALYSE DES STRUCTURES MÉCANIQUES PAR LA MÉTHODE DES ELEMENTS FINIS (MEC 568) contrôle non classant (7 mars 007, heures) Documents autorisés : polycopié ; documents et notes de

Plus en détail

association adilca www.adilca.com LE COUPLE MOTEUR

association adilca www.adilca.com LE COUPLE MOTEUR LE COUPLE MOTEUR Quelles sont les caractéristiques essentielles d un véhicule à moteur? Les services marketing le savent, c est la puissance et la vitesse maximale qui, au premier abord, focalisent l attention

Plus en détail

Application Form/ Formulaire de demande

Application Form/ Formulaire de demande Application Form/ Formulaire de demande Ecosystem Approaches to Health: Summer Workshop and Field school Approches écosystémiques de la santé: Atelier intensif et stage d été Please submit your application

Plus en détail

Arbres binaires de décision

Arbres binaires de décision 1 Arbres binaires de décision Résumé Arbres binaires de décision Méthodes de construction d arbres binaires de décision, modélisant une discrimination (classification trees) ou une régression (regression

Plus en détail