Les Méthodes PLS. Pierre-Louis Gonzalez. Michel Tenenhaus
|
|
|
- Stéphanie Bélanger
- il y a 9 ans
- Total affichages :
Transcription
1 Les Méthodes PLS Pierre-Louis Gonzalez Michel Tenenhaus 1
2 Les méthodes PLS initiées par Herman et Svante Wold I. NIPALS (Nonlinear Iterative Partial Least Squares) II. Régression PLS (Partial Least Squares Regression) II.1 PLS1 II.2 PLS2 III Analyse discriminante PLS IV. Régression logistique PLS 2
3 I. La méthode NIPALS Analyse en composantes principales Possibilité de données manquantes. Validation croisée pour choisir le nombre de composantes. Identification des outliers avec - une carte de contrôle des observations, - des tests sur les écarts au modèle de l ACP. 3
4 Utilisation de NIPALS :Exemple voitures Modèle Cylindrée Puissance Vitesse Poids Longueur Largeur Honda Civic Renault Fiat Tipo Citroën AX Sport Il y a une observation manquante par véhicule! Le principe de NIPALS: Comment projeter un point avec données manquantes? 4
5 Projection sur un axe x i * * * 0 * * * * * t i u x i o o o o o o t des x i ' u u ' u moindres i = = pente carrés de 0 la droite sans constante u de x i sur u 5
6 Projection d un point avec données manquantes sur un axe x i * * * 0 * * * * * t i u x i o Valeur manquante o o o o o S'il y a des données 0 manquantes u xi ' u ti = est calculé u' u disponibles sur les données 6
7 L algorithme NIPALS Recherche des composantes principales Données : X = {x ij } tableau n k, x j = variable j x i = observation i Modèle de l ACP : X = t 1 p t k p k avec (1) p 1,, p k orthonormés ( axes ) et (2) t 1,, t k orthogonaux ( composantes principales ) 7
8 L algorithme NIPALS Recherche de la première composante principale Modèle : X = t 1 p 1 + résidu, avec p 1 normé Algorithme : les équations de base (1) Si t 1 connu, calcul de p 1j par régression : x j = p 1j t 1 + résidu (2) Normalisation de p 1 = (p 11,,p 1k ) (3) Si p 1 connu, calcul de t 1i par régression : x i = t 1i p 1 + résidu Algorithme : fonctionnement - Prendre t 1 = x 1, puis itérer sur (1), (2), (3). - Si données manquantes, faire les calculs sur toutes les données disponibles. 8
9 Commentaires: Les relations cycliques découlant des équations de base de l algorithme montrent que λ 1 est la plus grande valeur propre vérifiant les équations suivantes: 1 n 1 1 n 1 X ' Xp = λ p X X ' t = λ t Nous avons divisé par n-1 pour retrouver les résultats de SIMCA. Ce calcul est une application de la méthode de la puissance itérée pour le calcul du vecteur propre d une matrice associé à la plus grande valeur propre ( Hotelling-1936; Anderson-1958) 9
10 Projection sur l axe 1 x i * * * 0 * * * * * t 1i p 1 x i o o o o o o x 'p i 1 t 1i = = p 1'p1 i 1 0 pente de la droite des moindres carrés sans constante de x sur p 10 p 1
11 L algorithme NIPALS Recherche des autres composantes principales La première étape donne : X = t 1 p 1 + X 1 On répète les opérations précédentes sur la matrice des résidus X 1 de la régression de X sur t 1. On obtient : X 1 = t 2 p 2 + X 2 et X = t 1 p 1 + t 2 p 2 + X 2 On obtient de même les autres composantes. 11
12 RESS h et PRESS h A chaque étape on étudie la reconstitution du tableau X : ' ' ' 1p1 + t 2p t hph Xˆ = t + Residual Sum of Squares : RESS 2 h (xij xˆ ij) i, j = Les cases de X sont partagées en G groupes, et on réalise G factorisations en enlevant à chaque fois un seul des groupes. Predicted Residual Sum of Squares : xˆ PRESS 2 h (xij xˆ ( ij) ) i,j = où ( ij) est calculé dans l analyse réalisée sans le groupe contenant la case (i,j). 12
13 L algorithme NIPALS Choix du nombre de composantes On choisit le nombre de composantes principales par validation croisée. La composante t h est retenue si Q 2 = 1 PRESS RESS h h 1 limite 13
14 Q 2 (cum) et R 2 (validation croisée) [ Q 2 cum ] h = 1 h PRESS RESS a a= 1 a 1 peu différent de R 2 validation croisée = 1 PRESS j h s 2 j / n 1 La composante h est retenue si : 2 2 [ Q cum ] h est nettement supérieur à [ Qcum] h 1 CONSEIL : Modèle à h composantes acceptable si [Q 2 cum] h >
15 Utilisation de NIPALS : Exemple voitures autobis.m1 (PC), Untitled, Work set Model Overview (cum) R2X(cum) Q2(cum) R2X(cum) & Q2(cum) Comp[1] Comp[2] Comp[3] Comp[4] Simca-P 8.0 by Umetrics AB :38 La validation croisée conduit à deux composantes. 15
16 NIPALS : Exemple Voitures Carte des variables ("les vecteurs propres") 0.6 VITESSE 0.4 PUISSANCE 0.2 p[2] p[1] CYLINDRÉE LONGUEUR POIDS LARGEUR Simca-P 3.01 by Umetri AB :26 16
17 NIPALS : Exemple Voitures Carte des voitures (les 2 premières "composantes principales") t[2] fiat uno ford fie citroen peugeot peugeot seat ibi bmw 325i audi 90 honda ci peugeot renault citroen fiat tip peugeot renault ford sie renault opel ome nissan v vw carav t[1] Ellipse: Hotelling T2 (0.05) rover bmw i renault ford sco Simca-P 3.01 by Umetri AB :29 17
18 NIPALS : Identification des outliers Carte de contrôle des distances au modèle normalisées 2.00 DCrit (0.05) 1.80 nissan vanet 1.60 bmw 325ix 1.40 ford scorpio DModX[2] honda civic renault 21 peugeot 405 fiat tipo renault 19 citroen bx bmw 530i renault 25 opel omega peugeot 205 renault espa vw caravelle audi 90 quat fiat uno 0.60 peugeot 405b ford sierra rover 827i ford fiesta peugeot 205r seat ibiza s citroen a Dcrit [2] = , Normalized distances, Non weighted residuals Simca-P 8.0 by Umetrics AB :00 18
19 Calcul de la limite de contrôle x i * Propriété : DModX * * * 2 d (xi, yi) F(k,k ) 1 n 1 2 y 2 i * * * d (xi, yi) n i= 1 * = Limite de contrôle : F0.95(k1,k2) 19
20 Probabilité d appartenir au modèle Test : H 0 : l observation i appartient au modèle de l ACP H 1 : l observation i n appartient pas au modèle Décision : On rejette H 0 au risque α de se tromper si DModX F1 α ( k1, k2) Niveau de signification ou «probabilité d appartenir au modèle» : Plus petit α conduisant au rejet de H 0 = Prob (F(k 1,k 2 ) DModX 2 ) L individu i est exactement sur la limite de contrôle DCrit(α min ) 20
21 NIPALS : Exemple Voitures "Probabilité" d'appartenir au modèle ACP (2 composantes) rover 827i ford fiesta citroen a seat ibiza s peugeot 205r M1.PModX[2] bmw 530i citroen bx renault 19 fiat tipo peugeot 405 renault 21 honda civic renault 25 opel omega ford sierra peugeot 405b audi 90 quat fiat uno vw caravelle renault espa peugeot bmw 325ix ford scorpio nissan vanet M1.Num Simca-P 8.0 by Umetrics AB :34 PModX(Nissan Vanette) =
22 II. La régression PLS Relier un bloc de variables à expliquer Y à un bloc de variables explicatives X. Possibilité de données manquantes. Il peut y avoir beaucoup plus de variables X que d observations. Il peut y avoir beaucoup plus de variables Y que d observations. Meilleure réponse au problème de la multicolinéarité. 22
23 La régression PLS : vocabulaire Régression PLS1 : un seul Y Régression PLS2 : plusieurs Y Analyse discriminante PLS : Y qualitatif transformé en variables indicatrices des modalités 23
24 II.1. La régression PLS1 :une idée de l algorithme Etape 1 : Recherche de m composantes orthogonales t h =Xa h bien explicatives de leur propre groupe et bien corrélées à y. Le nombre m est obtenu par validation croisée. Etape 2 : Régression de Y sur les composantes PLS t h. Etape 3 : Expression de la régression en fonction de X. 24
25 Objectif de l étape 1 de la régression PLS1 X 2 * * * * t 1 * * CPX 1 y * * * * * * * X 1 CPX 1 y * * * * * * t 1 25
26 La régression PLS1 : une idée de l étape 1 lorsqu il n y a pas de données manquantes Pour chaque h = 1 à m, on recherche des composantes t h =Xa h maximisant le critère Cov (Xa h, y) sous des contraintes de norme ( = 1 ) et d orthogonalité entre t h et les composantes précédentes t 1,, t h-1. a h 26
27 Propriétés de la régression PLS1 De Cov 2 (Xa h, y) = Cor 2 (Xa h, y)*var(xa h )*Var(y) on déduit que la régression PLS1 réalise un compromis entre la régression multiple de y sur X et l analyse en composantes principales de X. 27
28 Régression PLS1: Étape 1 1. Calcul de la première composante PLS t 1 : t = Xa = cor( y, x j ) x j 1 1 j Lors de cette étape les covariances sont égales aux corrélations, puisque toutes les données sont centrées réduites 2. Normalisation du vecteur a 1 = (a 11,,a 1k ) 3. Régression de y sur t 1 =Xa 1 exprimée en fonction des x 4. Calcul des résidus y 1 et X 1 des régressions de y et X sur t 1 : - y = c 1 t 1 + y 1 - X = t 1 p 1 + X 1 28
29 Régression PLS1: Étape 2 1. Calcul de la deuxième composante PLS t 2 : t = = 2 X1b2 cov( y1, x1 j ) x1 2. Normalisation du vecteur b 2 = (b 21,,b 2k ) j 3. Calcul de a 2 tel que : t 2 = X 1 b 2 = Xa 2 4. Régression de y 1 sur t 2 = Xa 2 exprimée en fonction des x 5. Calcul des résidus y 2 et X 2 des régressions de y et X 1 sur t 2 : - y 1 = c 2 t 2 + y 2 - X 1 = t 2 p 2 + X 2 j 29
30 Régression PLS1: Étapes suivantes On procède de la même manière pour les autres composantes. D où le modèle de régression PLS à m composantes : y = c 1 t 1 + c 2 t c m t m + Résidu = c 1 Xa 1 + c 2 Xa c m Xa m + Résidu = X(c 1 a 1 + c 2 a c m a m ) + Résidu = b 1 x 1 + b 2 x b k x k + Résidu ŷ 30
31 Calcul de RESS h et PRESS h à l étape h Residual Sum of Squares : où ŷ = c ( h 1),i ht hi RESS 2 h (y(h 1),i ŷ(h 1),i ) i = est la prévision de y (h-1),i Les observations sont partagées en G groupes, et on réalise G fois l étape courante de l algorithme sur y h-1 et X h-1 en enlevant à chaque fois un groupe. Predicted Residual Sum of Squares : ŷ PRESS 2 h (y(h 1),i ŷ(h 1), i) i = où est calculé dans l analyse réalisée sans le groupe (h 1), i contenant l observation (i). 31
32 Choix du nombre de composantes On choisit le nombre de composantes par validation croisée. La composante h est retenue si [PRESS h ] 0.95 [RESS h-1 ] Soit : Q 2 = 1 PRESS RESS h h
33 Q 2 (cum) et R 2 (validation croisée) [ Q 2 cum ] h = 1 h PRESS RESS a a= 1 a 1 peu différent de 2 PRESSh Rvalidation croisée = 1 2 ( y y) La composante h est retenue si : 2 2 [ Q cum ] h est nettement supérieur à [ Qcum] h 1 i i Modèle à h composantes acceptable si [Q 2 cum ] h >
34 Variable Importance in the Prediction (VIP) Composantes PLS : t h =X h-1 b h, avec b h = 1 Importance de la variable x j (j=1,, p) pour la prédiction de y dans un modèle à m composantes : VIP mj = m h= 1 R 2 p ( y, t h ) m h= 1 R 2 ( y, t h ) b 2 hj Moyenne des carrés des VIP = 1 Variable importante pour la prédiction si VIP >
35 Régression PLS1 : Exemple Voitures Problèmes : multicolinéarité, données manquantes Données complètes Modèle Prix Cylindrée Puissance Vitesse Poids Longueur Largeur Honda Civic Renault Fiat Tipo Citroën AX Sport Données incomplètes Modèle Prix Cylindrée Puissance Vitesse Poids Longueur Largeur Honda Civic Renault Fiat Tipo Citroën AX Sport
36 Régression multiple sur les données complètes R 2 = 0.847, F = Sig. = Unstandardized Coefficients Coefficients a Standardized Coefficients Model B Std. Error Beta t Sig. (Constant) CYLINDRE PUISSANC VITESSE POIDS LONGUEUR LARGEUR a. Dependent Variable: PRIX 36
37 Corrélations entre les variables Correlation Matrix PRIX CYLINDRE PUISSANC VITESSE POIDS LONGUEUR LARGEUR Correlation PRIX CYLINDRE PUISSANC VITESSE POIDS LONGUEUR LARGEUR
38 Régression PLS sur les données incomplètes Choix du nombre de composantes autopbis.m1 (PLS), Untitled, Work set Model Overview (cum) R2Y(cum) Q2(cum) R2Y(cum) & Q2(cum) Comp[1] Comp[2] Comp[3] Simca-P 8.0 by Umetrics AB :11 On retient une composante PLS 38
39 Régression PLS sur les données incomplètes R 2 = Équation sur les données centrées-réduites (CoeffCS) Prix σ (Prix) = Cylindrée* Puissance* Vitesse* Poids* Longueur* Largeur* Équation sur les données d origine (Coeff) Prix = Cylindrée + 328Puissance + 339Vitesse + 40Poids + 205Longueur Largeur Équation sur les données d origine pour Y et centrées pour X (CoeffC) Prix = (Cylindrée ) + 328(Puissance - 112) + 339(Vitesse - 182) + 40(Poids ) + 205(Longueur - 422) (Largeur - 168) 39
40 Résultats de la validation croisée sur les coefficients de régression PLS Audi 90 Quattro LARGEUR LONGUEUR POIDS VITESSE PUISSANC CYLINDRE PRIX 40
41 Résultats de la validation croisée sur les coefficients de régression PLS Cylindrée Puissance Vitesse Poids Longueur Largeur B SE Student T p-value
42 Carte des variables X Y 0.60 PUISSANCE 0.40 w*c[2] PRIX VITESSE POIDS CYLINDRÉE LONGUEUR LARGEUR w*c[1] 42
43 Validation globale Autoprib.M1 (PLS): Validate Model PRIX Intercepts: R2=(0.0, ), Q2=(0.0, ) R2 Q permutations 1 components - Abscisse : Corrélation entre Y et Y permuté - Ordonnée : R2 et Q2 de la régression PLS de Y permuté sur X - Les droites noire et rouge sont les droites des moindres carrés 43
44 Exemple Voitures Variable Importance in the Projection (1 composante) VIP[1] PUISSANC CYLINDRE POIDS LONGUEUR VITESSE LARGEUR Simca-P 8.0 by Umetrics AB :05 44
45 Régression PLS sur les données incomplètes AUTOPRIB.M1 (PLS), Modèle 1, Work set PRIX, Comp 1(Cum) renault audi 90 bmw 325i bmw 530i renault ford sco rover 82 Y ford fie fiat uno honda ci peugeot citroen peugeot seat fiat ibi tip peugeot citroen nissan renault v renault vw carav peugeot ford sie opel ome Predicted RMSEE=28979 Simca-P 7.01 by Umetri AB :40 45
46 Intervalle de confiance à 95% du prix moyen (fourni par SIMCA) PRIX prévision 46
47 Intervalle de prévision à 95% du prix (à calculer) audi 90 quattro PRIX prévision 47
48 Prédiction du prix de la HONDA CIVIC (Problème : certains X sont manquants) Prix de vente : FF Cylindrée Puissance Vitesse Poids Longueur Largeur Caractéristiques de la Honda Civic? Caractéristiques centrées-réduites?
49 Prédiction du Prix de la HONDA CIVIC Régression du Prix sur t 1 : Prix t Calcul de tps 1 pour la HONDA CIVIC : - Régression : X j = p 1j t 1 + erreur, j = 1,, p p 1 = (p 11,, p 1p ) - Régression : x i = tps 1i p 1 + erreur 1 sur les données disponibles; d où le calcul de tps 1i tps 1 (Honda Civic) = est l estimation de t 1i Prédiction du prix de la HONDA CIVIC - On utilise tps1 à la place de t 1 Prédiction du Prix = FF 49
50 Prédiction du Prix de la HONDA CIVIC : calcul de tps 1 (Honda Civic) Cylindrée Puissance Vitesse Poids Longueur Largeur P ? x Honda = tps 1 ( Honda) tps 1 (Honda) =
51 Régression PLS1 : Cas UOP Guided Wave Problème : 226 variables X et 26 observations Les données : Y = indice d octane X 1, X 2,, X 226 : valeurs d absorbance à différentes longueurs d onde Données de calibration : 26 échantillons d essence (dont 2 avec alcool) Données de validation : 13 échantillons d essence (dont 4 avec alcool) 51
52 Cas UOP Guided Wave Visualisation des X e a m p H17 l H36 e 1500 S s X - V a r i a b l e s Octane - Matrix Plot, Sam.Set: All Samples, Var.Set: Selected Variables 52
53 Cas UOP Guided Wave Visualisation des X : Données de calibration M52 H Sequence number Les échantillons M52 et H59 contiennent de l alcool 53
54 Cas UOP Guided Wave Visualisation des X : Données de validation Numéro de la longueur d'onde Les échantillons avec alcool sont en rouge 54
55 Régression PLS1 : les résultats Données de spectroscopie Les données sont centrées, mais non réduites Validation croisée : 3 composantes PLS 55
56 UOP Guided Wave : Les composantes PLS OCTANE.M4 (PLS), Untitled, Work set Scores: t[1]/t[2] t[2] H39 H11 H20 H24 H27 H12 H38 H17 H36 L13 M01 M18 L21 M02 M05 H32 L37 L14 L29 L40 L06 L35 L15 L31 M52 H t[1] Ellipse: Hotelling T2 (0.05) Simca-P 7.01 by Umetri AB :14 - Indice d octane : L = Low, M = Medium, H = High - Les échantillons M52 et H59 contiennent de l alcool 56
57 UOP Guided Wave : les composantes PLS OCTANE.M4 (PLS), Untitled, Work set Scores: t[2]/t[3] H32 H36 H38 H17 t[3] M52 H59 L31 L40 L15 L14 L06 L29 L35 M02 M05 M18 M01 H11 H20 H27 H L21 L37 L13 H12 H t[2] Ellipse: Hotelling T2 (0.05) Simca-P 7.01 by Umetri AB :41 Indice d octane : L = Low, M = Medium, H = High 57
58 Cas UOP Guided Wave : Prévision Données de calibration OCTANE.M4 (PLS), Untitled, Work set OCTANE, Comp 3(Cum) H38 H24H20 H27 H39 H17 H12 H36 H11 H32 H59 Y L15 L14 L29 L31 L35 L06 L37 L40 L21 L13 M02 M52 M01 M05 M Predicted RMSEE= Simca-P 7.01 by Umetri AB :53 58
59 Cas UOP Guided Wave : Prévision Données de validation OCTANE.M5 (PLS), Untitled, PS-OCTANE OCTANE, Comp 3 (Cum) S.022S.026 S.010 S.057 S.058 S.016 S.055 Observed S.004 S.025 S.003 S.019 S S Predicted RMSEP= Simca-P 7.01 by Umetri AB :11 Présence d alcool : OUI / NON 59
60 II.2 La régression PLS2 Relier un bloc de variables à expliquer Y à un bloc de variables explicatives X. Possibilité de données manquantes. Il peut y avoir beaucoup plus de variables X que d observations. Il peut y avoir beaucoup plus de variables Y que d observations. 60
61 La régression PLS2 : une idée de l algorithme Etape 1 : Recherche de m composantes orthogonales t h =Xa h et m composantes u h =Yb h bien corrélées entre elles et explicatives de leur propre groupe. Le nombre m est obtenu par validation croisée. Etape 2 : Régression de Y sur les composantes t h. Etape 3 : Expression de la régression en fonction de X. 61
62 Objectif de l étape 1 de la régression PLS2 X 2 * * * * t 1 * * CPX 1 Y 2 * * * * * * * CPY 1 u 1 X 1 Y 1 u 1 * * * * * * t 1 62
63 La régression PLS2 : une idée de l étape 1 lorsqu il n y a pas de données manquantes Pour chaque h = 1 à m, on recherche des composantes t h =Xa h et u h = Yb h maximisant le critère Cov (Xa h, Yb h ) sous des contraintes de norme et d orthogonalité entre t h et les composantes précédentes t 1,, t h-1. 63
64 Interprétation du critère de Tucker De Cov 2 (Xa h,yb h ) = Cor 2 (Xa h,yb h )* Var(Xa h )*Var(Yb h ) on déduit que la régression PLS réalise un compromis entre l analyse canonique de X et Y, une ACP de X, et une ACP «oblique» de Y. 64
65 Variable Importance in the Prediction (VIP) Composantes PLS : t h =X h-1 b h, avec b h = 1 Importance de la variable x j (j=1, p) pour la prédiction des y k (k=1, q) dans un modèle à m composantes : VIP mj = m q h= 1 k= 1 R p 2 ( y k ; t h ) m q [ h= 1 k= 1 R 2 ( y k, t h )] b 2 hj Moyenne des carrés des VIP = 1 Variable importante pour la prévision si VIP >
66 Régression PLS2 Exemple 1: Dégustation de thé Les données Obs Température Sucré Force Citron Sujet 1 Sujet Température Sucré Force Citron 1 = Chaud 2 = Tiède 3 = Glacé 1 = Pas de sucre 2 = 1 sucre 3 = 2 sucres 1 = Fort 2 = Moyen 3 = Faible 1 = Avec 2 = Sans 66
67 Cas Dégustation de thé Bloc X Variables indicatrices des modalités de Température, Sucré, Force et Citron Bloc Y Les classements des sujets 67
68 Cas Dégustation de thé Résultats de la régression PLS Validation croisée : 3 composantes : t h =Xw h * et u h =Yc h Équation de régression de Y k sur t 1,, t h : Y k = c 1k t 1 + c 2k t 2 + c 3k t 3 + c 4k t 4 + résidu Les variables X et Y sont représentées à l aide des vecteurs w h * et c h. 68
69 Cas Dégustation de thé Carte des variables THE.M1 (PLS), régression PLS, Workset Loadings: w*c[1]/w*c[2] 0.6 Y5 Y3 w*c[2] SUCRE2 TIEDE CHAUD CITRON0 FORT Y1 MOYEN Y2 SUCRE1 GLACÉ Y4 SUCRE0 Y6 CITRON1 LEGER w*c[1] Simca-P 3.01 by Umetri AB :11 69
70 Cas dégustation de thé Visualisation de la régression PLS de Y 1 sur X THE.M1 (PLS), régression PLS, Workset Loadings: w*c[1]/w*c[2] THE régression PLS M1.Y1 (CoeffCS) [4] w*c[2] Y5 SUCRE2 CITRON0 FORT MOYEN SUCRE1 Y3 CHAUD FROID Y4 SUCRE0 Y1 Y2 CoeffCS5[4] Y6 TIEDE CITRON1 LEGER w*c[1] Simca-P 3.01 by Umetri AB : CHAUD TIEDE FROID SUCRE0 SUCRE1 SUCRE2 FORT MOYEN LEGER CITRON1 CITRON0 Simca-P 3.01 by Umetri AB :14 Règle d interprétation: Les projections des variables X sur les variables Y reflètent le signe et l ordre de grandeur des coefficients de régression PLS des Y sur X. Le juge 1 aime son thé chaud et rejette le thé tiède 70
71 Validation du modèle pour le juge CoeffCS[4](Y1) CHAUD TIEDE FROID SUCRE0 SUCRE1 SUCRE2 FORT MOYEN LEGER CITRON1 CITRON0 Var ID (Primary)
72 Cas dégustation de thé Visualisation de la régression PLS de Y 5 sur X THE.M1 (PLS), régression PLS, Workset Loadings: w*c[1]/w*c[2] THE régression PLS M1.Y5 (CoeffCS) [4] 0.6 Y5 Y3 0.4 w*c[2] SUCRE2 CITRON0 FORT MOYEN SUCRE1 CHAUD FROID Y4 SUCRE0 Y1 Y2 CoeffCS9[4] Y6 TIEDE CITRON1 LEGER w*c[1] Simca-P 3.01 by Umetri AB : CHAUD TIEDE FROID SUCRE0 SUCRE1 SUCRE2 FORT MOYEN LEGER CITRON1 CITRON0 Simca-P 3.01 by Umetri AB :26 Le juge 5 préfère son thé sans citron, fort; il est indifférent au thé tiède; il rejette le thé léger, avec du citron. 72
73 Validation du modèle pour le juge 5 73 CoeffCS[4](Y5) CHAUD TIEDE FROID SUCRE0 SUCRE1 SUCRE2 FORT MOYEN LEGER CITRON1 CITRON0 Var ID (Primary)
74 Carte des produits dans l espace des juges Dégustation de thés Scores: u[1]/u[2] u [ 2 ] u[1] Simca-P 8.0 by Umetrics AB :19 74
75 Variable Importance in the Projection (VIP) THE.M1 (PLS), Untitled, Work set VIP, Comp 4(Cum) VIP[4] TIEDE CHAUD SUCRE0 SUCRE2 LEGER CITRON1 CITRON0 Simca-P 8.0 by Umetrics AB :01 FORT FROID MOYEN SUCRE1 75
76 III. Analyse discriminante PLS Bloc Y La variable qualitative Y est remplacée par l ensemble des variables indicatrices de ses modalités. Bloc X Variables numériques ou indicatrices des modalités des variables qualitatives. Régression PLS de Y sur X 76
77 Analyse discriminante PLS : exemple Les données 16 biopsies de tumeurs de cerveau humain. Chaque tumeur est classée par un médecin anatomopathologiste comme bénigne ou maligne. Chaque biopsie est analysée par chromatographie en phase gazeuse : on obtient un profil métabolique de la biopsie formé de 156 pics. Quelques données manquantes Article: Jellum E., Bjørnson I., Nesbakken R., Johanson E., Wold S. Classification of human cancer cells by means of capillary gas chromatography and pattern recognition analysis. ( Journal of Chromatography, 1981) 77
78 Analyse discriminante PLS Profils métaboliques des biopsies T2 T3 T6 T N1 N4 N5 N T8 T9 T10 T N T N T16 Sequence number Tumeurs bénignes Sequence number Tumeurs malignes 78
79 Analyse en composantes principales des 16 biopsies Composantes principales 1 et 2 EGI1.M4 (PC), Untitled, Work set Scores: t[1]/t[2] 10 N15 N13 t[2] T8 T12 T7 T6 T3T11 T16 N14 T9 T10 T2 N1 N4-10 N t[1] Ellipse: Hotelling T2 (0.05) Simca-P 7.01 by Umetri AB :17 79
80 Analyse en composantes principales des 16 biopsies Composantes principales 1 et 3 EGI1.M4 (PC), Untitled, Work set Scores: t[1]/t[3] 10 N14 5 N5 t[3] 0-5 T8T12 T6 T7 T16 T9 T3 T11 T10 T2 N15 N1 N13 N t[1] Ellipse: Hotelling T2 (0.05) Simca-P 7.01 by Umetri AB :19 80
81 Analyse discriminante PLS Composantes PLS 1 et 2 EGI1.M5 (PLS), Untitled, Work set Scores: t[1]/t[2] 10 N14 t[2] T8 T12 T7 T6 T3 T11 T16 T9 T10 T2 N15 N5 N1 N13 N t[1] Ellipse: Hotelling T2 (0.05) Simca-P 7.01 by Umetri AB :22 81
82 IV. Régression logistique PLS Bonne solution au problème de la multicolinéarité. Il peut y avoir beaucoup plus de variables que d observations. Il peut y avoir des données manquantes. Présentation de trois algorithmes 82
83 Qualité des vins de Bordeaux Variables observées sur 34 années ( ) TEMPERATURE : Somme des températures moyennes journalières SOLEIL : Durée d insolation CHALEUR : Nombre de jours de grande chaleur PLUIE : Hauteur des pluies QUALITE DU VIN : Bon, Moyen, Médiocre 83
84 Régression logistique ordinale Y = Qualité : Bon (1), Moyen (2), Médiocre (3) PROB(Y i) = e αi+β1température+β2soleil+β3chaleur+β4pluie 1 + e αi+β1température+β2soleil+β3chaleur+β4pluie 84
85 Régression logistique ordinale Résultats SAS Score Test for the Proportional Odds Assumption Chi-Square = with 4 DF (p=0.5720) Analysis of Maximum Likelihood Estimates Parameter Standard Wald Pr > Variable DF Estimate Error Chi-Square Chi-Square INTERCP INTERCP TEMPERA SOLEIL CHALEUR PLUIE
86 Régression logistique ordinale Qualité de prévision du modèle QUALITE PREVISION OBSERVEE Effectif Total ƒƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒˆ ƒƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒˆ ƒƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒˆ ƒƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒˆ Total Résultat : 7 années mal classées 86
87 Régression logistique ordinale Commentaires Le modèle à pentes égales est acceptable (p = 0.572). La chaleur a une influence positive sur la qualité du vin de Bordeaux, alors qu elle apparaît comme non significative et avec un coefficient négatif dans le modèle. C est un problème de multicolinéarité. Il y a 7 années mal classées. 87
88 Algorithme 1 : La régression logistique PLS Etape 1 : Recherche de m composantes orthogonales T h =Xa h explicatives de leur propre groupe et bien prédictives de y. Le nombre m est obtenu par validation croisée. Etape 2 : Régression logistique de Y sur les composantes T h. Etape 3 : Expression de la régression logistique en fonction de X. 88
89 Régression logistique PLS Étape 1 1. Régression logistique de y sur chaque x j : les coefficients de régression a 1j 2. Normalisation du vecteur a 1 = (a 11,,a 1k ) 3. Régression logistique de y sur T 1 =Xa 1 exprimée en fonction des X 4. Calcul du résidu X 1 de la régression de X sur T 1 89
90 Régression logistique PLS Étape 2 1. Régression logistique de y sur T 1 et chaque résidu x 1j : les coefficients de régression b 2j 2. Normalisation du vecteur b 2 = (b 21,,b 2k ) 3. Calcul de a 2 tel que : T 2 = X 1 b 2 = Xa 2 4. Régression logistique de y sur T 1 = Xa 1 et T 2 = Xa 2 exprimée en fonction des X 5. Calcul du résidu X 2 de la régression de X sur T 1, T 2 90
91 Régression logistique PLS Choix du nombre de composantes On procède de la même manière pour les autres étapes. On choisit le nombre de composantes par validation croisée : la composante h est retenue si 2 [ χ Pearson 0.95 Soit : (validation croisée, Q 2 = 2 étape h)] [ χ Pearson (substitution, 2 χ validation croisée, étape 1 2 χ substituti on, étape h -1 1/ 2 étape h h -1)] / 2 91
92 Régression logistique PLS Résultats de l algorithme La température de 1924 est supposée inconnue. La régression logistique PLS de Y sur X a conduit à deux composantes PLS T 1 et T 2 : T 1 = 0.57 Température Soleil Chaleur Pluie T 2 = Température Soleil Chaleur Pluie 92
93 Régression logistique ordinale sur T 1, T 2 Résultats SAS Analysis of Maximum Likelihood Estimates Parameter Standard Wald Pr > Variable DF Estimate Error Chi-Square Chi-Square INTERCP INTERCP T T TABLEAU CROISANT QUALITÉ OBSERVÉE ET PRÉDITE QUALITÉ PRÉDICTION Effectif Total ƒƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒˆ ƒƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒˆ ƒƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒˆ ƒƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒˆ Total Résultat : 5 années mal classées 93
94 94 Régression logistique PLS Le modèle Prob (Y i) T T T T e 1 e = Moyen Bon Moyen Bon Pluie Chaleur Soleil Temp. Moyen Bon Pluie Chaleur Soleil Temp. Moyen Bon = e 1 e
95 Algorithme 2 Régression logistique sur composantes PLS (1) Régression PLS des indicatrices de Y sur les X. (2) Régression logistique de Y sur les composantes PLS des X. 95
96 Régression logistique sur les composantes PLS Résultats La température de 1924 est supposée inconnue. La régression PLS des indicatrices de Y sur X a conduit à une seule composante PLS t 1 (résultat de la validation croisée). t 1 = 0.55 Température Soleil Chaleur 0.40 Pluie Pour l année 1924 : t 1 = (0.55 Soleil Chaleur 0.40 Pluie)/
97 Utilisation de la régression PLS pour la prévision de la qualité du vin de Bordeaux The PLS Procedure Cross Validation for the Number of Latent Variables TABLE OF QUALITE BY PREV Test for larger residuals than minimum Number of Root Latent Mean Prob > Variables PRESS PRESS ƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒ Minimum Root Mean PRESS = for 1 latent variable Smallest model with p-value > 0.1: 1 latent Choix d une composante PLS QUALITE PREV Frequency 1 3 Total ƒƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒˆ ƒƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒˆ ƒƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒˆ ƒƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒˆ Total Résultat : 12 années mal classées 97
98 Résultats de la régression logistique de Y sur la composante PLS t 1 Analysis of Maximum Likelihood Estimates Parameter Standard Wald Pr > Variable DF Estimate Error Chi-Square Chi-Square INTERCP INTERCP t TABLEAU CROISANT QUALITÉ OBSERVÉE ET PRÉDITE QUALITÉ PRÉDICTION Effectif Total ƒƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒˆ ƒƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒˆ ƒƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒˆ ƒƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒˆ Total Résultat : 6 années mal classées 98
99 Régression logistique sur composantes PLS Le modèle Prob (Y i) 2.15 Bon Moyen e t1 = 2.15 Bon Moyen t 1 1+ e = e Bon Moyen Temp Soleil Chaleur 1.07 Pluie e 2.15 Bon Moyen Temp Soleil Chaleur 1.07 Pluie 99
100 Conclusion 1: Régression logistique PLS vs régression logistique sur composantes PLS Les deux algorithmes présentés devraient avoir des qualités comparables. L algorithme 2 est beaucoup plus simple : Deux étapes : (1) Régression PLS des indicatrices de Y sur X (2) Régression logistique de Y sur les composantes PLS 100
101 Conclusion 2: Le modèle linéaire généralisé PLS Le modèle linéaire généralisé PLS peut être construit selon les mêmes procédures. Approche beaucoup plus simple que la méthode de Brian Marx : «Iteratively Reweighted Partial Least Square Estimation for Generalized Linear Regression», Technometrics,
102 Algorithme 3 (données groupées) Régression PLS du logit de la variable de réponse sur les prédicteurs Exemple : Job satisfaction (Zelterman, 1999) 9949 employees in the craft job within a company Response : Satisfied/Dissatisfied Factors : Sex, Race (White/Nonwhite), Age (<35, 35-44, >44) Region (Northeast, Mid-Atlantic, Southern, Midwest, Northwest, Southwest, Pacific) Explain Job satisfaction with all the main effects and the interactions. 102
103 Une approche exploratoire (1) Régression PLS de Y 1 = Logit(proportion of satisfied people) Y 2 = Logit(proportion of non satisfied people) sur les 4 facteurs et toutes les interactions. (2) Élimination itérative des termes à petits VIP, en vérifiant l augmentation du Q 2 (cum) (3) Carte des variables finalement retenues 103
104 Résultat de la Régression PLS sur les logits MEN 0.30 YOUNG in NORTHEAST WOMEN in MIDWEST 0.20 NON SATISFIED NONWHITE WOMEN NORTHEAST w*c[2] YOUNG YOUNG in MIDWEST WOMEN in NORTHEAST YOUNG WHITE MID-ATLANTIC WHITE in MID-ATLANTIC OLD WHITE OLD in MID-ATLANTIC SOUTHERN SATISFIED YOUNG WOMEN NONWHITE MEN WOMEN w*c[1] OLD in SOUTHERN Y 1 = Logit (Proportion of Satisfied) Y 2 = Logit (Proportion of Non Satisfied) X = Explanatory variables kept after elimination of small VIP terms 104
105 Quelques références sur les méthodes PLS Régression PLS - L. Eriksson, E. Johansson, N. Kettaneh-Wold & S. Wold : Multi- and Megavariate Data Analysis using Projection Methods (PCA & PLS), Umetrics, H. Martens & M. Martens : Multivariate Analysis of Quality, Wiley, H. Martens & T. Næs : Multivariate calibration, Wiley, SIMCA 12.0 : PLS Software, S. WOLD, UMETRI (Sweden), distribué par SIGMA PLUS - M. Tenenhaus : La régression PLS, Editions Technip, 1998 Approche PLS (PLS Path modelling) - J.-B. Lohmöller : Latent variable path modeling with partial least squares, Physica-Verlag, LVPLS 1.8 : Software for Latent variables path analysis with partial least-squares estimation, J.-B. Lohmöller, M. Tenenhaus : L approche PLS, R.S.A., 47 (2), 5-40,
Exemple PLS avec SAS
Exemple PLS avec SAS This example, from Umetrics (1995), demonstrates different ways to examine a PLS model. The data come from the field of drug discovery. New drugs are developed from chemicals that
ACP Voitures 1- Méthode
acp=princomp(voit,cor=t) ACP Voitures 1- Méthode Call: princomp(x = voit, cor = T) Standard deviations: Comp.1 Comp.2 Comp.3 Comp.4 Comp.5 Comp.6 2.1577815 0.9566721 0.4903373 0.3204833 0.2542759 0.1447788
distribution quelconque Signe 1 échantillon non Wilcoxon gaussienne distribution symétrique Student gaussienne position
Arbre de NESI distribution quelconque Signe 1 échantillon distribution symétrique non gaussienne Wilcoxon gaussienne Student position appariés 1 échantillon sur la différence avec référence=0 2 échantillons
Lire ; Compter ; Tester... avec R
Lire ; Compter ; Tester... avec R Préparation des données / Analyse univariée / Analyse bivariée Christophe Genolini 2 Table des matières 1 Rappels théoriques 5 1.1 Vocabulaire....................................
Modèles pour données répétées
Résumé Les données répétées, ou données longitudinales, constituent un domaine à la fois important et assez particulier de la statistique. On entend par données répétées des données telles que, pour chaque
Huiles moteurs pour véhicules légers
Contact: Huiles moteurs pour véhicules légers FUCHS LUBRIFIANT FRANCE DIVISION AUTO MOTO 81, RUE DE L'INDUSTRIE 92500 RUEIL-MALMAISON TEL. : 01.41.37.42.00 FAX : 01.41.37.42.01 www.fuchs-oil.fr Des huiles
Exemples d application
AgroParisTech Exemples d application du modèle linéaire E Lebarbier, S Robin Table des matières 1 Introduction 4 11 Avertissement 4 12 Notations 4 2 Régression linéaire simple 7 21 Présentation 7 211 Objectif
Exercices M1 SES 2014-2015 Ana Fermin (http:// fermin.perso.math.cnrs.fr/ ) 14 Avril 2015
Exercices M1 SES 214-215 Ana Fermin (http:// fermin.perso.math.cnrs.fr/ ) 14 Avril 215 Les exemples numériques présentés dans ce document d exercices ont été traités sur le logiciel R, téléchargeable par
Consommation de flotte (1989 2012)
Bases et méthodologie de comparaison L Association des importateurs suisses d automobiles «auto-suisse» établit chaque année la consommation moyenne des voitures de tourisme vendues appelée consommation
MODELE A CORRECTION D ERREUR ET APPLICATIONS
MODELE A CORRECTION D ERREUR ET APPLICATIONS Hélène HAMISULTANE Bibliographie : Bourbonnais R. (2000), Econométrie, DUNOD. Lardic S. et Mignon V. (2002), Econométrie des Séries Temporelles Macroéconomiques
Analyse de variance à deux facteurs (plan inter-sujets à deux facteurs) TP9
Analyse de variance à deux facteurs (plan inter-sujets à deux facteurs) TP9 L analyse de variance à un facteur permet de vérifier, moyennant certaines hypothèses, si un facteur (un critère de classification,
Étude de cas Assurance (d après une étude de Philippe Périé, CISIA)
Étude de cas Assurance (d après une étude de Philippe Périé, CISIA) I.1.Les données L échantillon est constitué de 1106 assurés Belges observés en 1992 et répartis en 2 groupes. - les assurés qui n ont
Données longitudinales et modèles de survie
ANALYSE DU Données longitudinales et modèles de survie 5. Modèles de régression en temps discret André Berchtold Département des sciences économiques, Université de Genève Cours de Master ANALYSE DU Plan
LOW COST TOUT INCLUS FIAT PANDA. Moteur: Essence A/C Radio CD Assurance tous risques sans franchise Réservoir plein PRIX / SEMAINE
LOW COST TOUT INCLUS FIAT PANDA Assurance tous risques sans franchise Réservoir plein 01.01.15-30.06.15 20.09.15 30.06.15 01.07.15-31.07.15 01.08.15-23.08.15 23.08.15-20.09.15 190 240 315 240 LOW COST
Un exemple de régression logistique sous
Fiche TD avec le logiciel : tdr341 Un exemple de régression logistique sous A.B. Dufour & A. Viallefont Etude de l apparition ou non d une maladie cardiaque des coronaires 1 Présentation des données Les
Honda se place en tête de la satisfaction des propriétaires français de nouveaux véhicules pour la troisième année consécutive
Etude de J.D. Power and Associates en partenariat avec L Automobile Magazine : La satisfaction des propriétaires de véhicules en France diminue considérablement par rapport à 2010 Honda se place en tête
2 nd semestre. Synthèse de l étude D3 Parcours Analyse de la fidélité des clients par marque. En partenariat avec
2 nd semestre 2014 Synthèse de l étude D3 Parcours Analyse de la fidélité des clients par marque En partenariat avec Note de synthèse 1 +33 6 87 70 31 12 1. Cadre général L étude D3 Parcours est réalisée
Nouveau : Une technologie avant-gardiste d huile moteur
Les informations contenues dans cette brochure sont basées sur l'expérience et le savoir-faire de FUCHS EUROPE SCHMIERSTOFFE GMBH dans le développement et la fabrication de lubrifiants et représentent
WWW.ATD-FRANCE.COM BOÎTES DE VITESSES MANUELLES AUTOMATIQUES FRANCE 05 57 68 17 68 PARIS 0 820 250 200
WWW.ATD-FRANCE.COM 2013 BOÎTES DE VITESSES MANUELLES AUTOMATIQUES FRANCE 05 57 68 17 68 PARIS 0 820 250 200 1 CHOISIR LE LEADER DU RECONDITIONNEMENT DE BOÎTES DE VITESSES EN FRANCE C'EST S'ASSURER : LA
BERU Eyquem SAS 101, Avenue François Arago F-92017 Nanterre Cédex / France Téléphone: 01.55.69.31.50 Fax: 01.55.69.31.99
BERU Eyquem SAS 101, Avenue François Arago F-92017 Nanterre Cédex / France Téléphone: 01.55.69.31.50 Fax: 01.55.69.31.99 Imprimé en Germany 10.9.06 N de commande 5.100.001.056 www.beru.com 10 bonnes raisons
"Étude TOPÉO" Le Concept de la voiture low cost en France => Cas concret : la NANO de TATA
"Étude TOPÉO" Le Concept de la voiture low cost en France => Cas concret : la NANO de TATA Étude en Ligne, réalisée par CEGMA TOPO, du 0 au 06 avril 009 Auprès de 360 individus : titulaires du permis de
Utilisation du Logiciel de statistique SPSS 8.0
Utilisation du Logiciel de statistique SPSS 8.0 1 Introduction Etude épidémiologique transversale en population générale dans 4 pays d Afrique pour comprendre les différences de prévalence du VIH. 2000
Une introduction. Lionel RIOU FRANÇA. Septembre 2008
Une introduction INSERM U669 Septembre 2008 Sommaire 1 Effets Fixes Effets Aléatoires 2 Analyse Classique Effets aléatoires Efficacité homogène Efficacité hétérogène 3 Estimation du modèle Inférence 4
Programmation Linéaire - Cours 1
Programmation Linéaire - Cours 1 P. Pesneau [email protected] Université Bordeaux 1 Bât A33 - Bur 265 Ouvrages de référence V. Chvátal - Linear Programming, W.H.Freeman, New York, 1983.
1 Complément sur la projection du nuage des individus
TP 0 : Analyse en composantes principales (II) Le but de ce TP est d approfondir nos connaissances concernant l analyse en composantes principales (ACP). Pour cela, on reprend les notations du précédent
Introduction aux Statistiques et à l utilisation du logiciel R
Introduction aux Statistiques et à l utilisation du logiciel R Christophe Lalanne Christophe Pallier 1 Introduction 2 Comparaisons de deux moyennes 2.1 Objet de l étude On a mesuré le temps de sommeil
Évaluation de la régression bornée
Thierry Foucart UMR 6086, Université de Poitiers, S P 2 M I, bd 3 téléport 2 BP 179, 86960 Futuroscope, Cedex FRANCE Résumé. le modèle linéaire est très fréquemment utilisé en statistique et particulièrement
Problème d ordonnancement de véhicules en variables booléennes
Problème d ordonnancement de véhicules en variables booléennes Freddy Hetman 2 juillet 2013 Faculté des sciences Jean Perrin Freddy Hetman () 2 juillet 2013 1 / 22 Sommaire 1 Introduction 2 Le problème
Introduction à la statistique non paramétrique
Introduction à la statistique non paramétrique Catherine MATIAS CNRS, Laboratoire Statistique & Génome, Évry http://stat.genopole.cnrs.fr/ cmatias Atelier SFDS 27/28 septembre 2012 Partie 2 : Tests non
01-2014 Brochure ALD ELECTRIC PART OF ALD NEWMOBILITY
01-2014 Brochure ALD ELECTRIC PART OF ALD NEWMOBILITY 1 Brochure ALD electric INTRODUCTION Notre offre ALD electric se compose d une gamme très complète de véhicules électriques comprenant des hybrides
Méthode : On raisonnera tjs graphiquement avec 2 biens.
Chapiittrre 1 : L uttiilliitté ((lles ménages)) Définitions > Utilité : Mesure le plaisir / la satisfaction d un individu compte tenu de ses goûts. (On s intéresse uniquement à un consommateur rationnel
I - PUISSANCE D UN POINT PAR RAPPORT A UN CERCLE CERCLES ORTHOGONAUX POLES ET POLAIRES
I - PUISSANCE D UN POINT PAR RAPPORT A UN CERCLE CERCLES ORTHOGONAUX POLES ET POLAIRES Théorème - Définition Soit un cercle (O,R) et un point. Une droite passant par coupe le cercle en deux points A et
1 Modélisation d être mauvais payeur
1 Modélisation d être mauvais payeur 1.1 Description Cet exercice est très largement inspiré d un document que M. Grégoire de Lassence de la société SAS m a transmis. Il est intitulé Guide de démarrage
Analyse de la variance Comparaison de plusieurs moyennes
Analyse de la variance Comparaison de plusieurs moyennes Biostatistique Pr. Nicolas MEYER Laboratoire de Biostatistique et Informatique Médicale Fac. de Médecine de Strasbourg Mars 2011 Plan 1 Introduction
Adaptez-vous aux nouvelles tendances de la distribution automobile
Adaptez-vous aux nouvelles tendances de la distribution automobile Les nouvelles tendances de la distribution automobile Le comportement du client Le client est exigeant Le client a conscience de sa valeur
Analyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés
Analyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés Professeur Patrice Francour [email protected] Une grande partie des illustrations viennent
La classification automatique de données quantitatives
La classification automatique de données quantitatives 1 Introduction Parmi les méthodes de statistique exploratoire multidimensionnelle, dont l objectif est d extraire d une masse de données des informations
NOUVELLE série KTS pour un diagnostic confortable, rapide et fiable
NOUVELLE série KTS pour un diagnostic confortable, rapide et fiable Confortable - Connexion Bluetooth USB spécifique Bosch Rapide - Du branchement aisé de l équipement de mesure jusqu à la détermination
Séquence 9. Étudiez le chapitre 11 de physique des «Notions fondamentales» : Physique : Dispersion de la lumière
Séquence 9 Consignes de travail Étudiez le chapitre 11 de physique des «Notions fondamentales» : Physique : Dispersion de la lumière Travaillez les cours d application de physique. Travaillez les exercices
PRIX AUTO ENVIRONNEMENT MAAF 2014
INFORMATION PRESSE Le 4 juin 2014 PRIX AUTO ENVIRONNEMENT MAAF 2014 La PEUGEOT 308 1,2L PURETECH STOP&START élue Grand Prix Auto Environnement Attribution d un Prix Spécial 10 ans pour Toyota pour sa gamme
Marché de l'automobile - Automobile - Type de carrosserie - Modèle d'automobile
Le marché automobile est fréquemment analysé sous forme de segments ou catégories de voitures, qui indiquent le positionnement de chaque modèle sur le marché. Catégories : Marché de l'automobile - Automobile
Chapitre 02. La lumière des étoiles. Exercices :
Chapitre 02 La lumière des étoiles. I- Lumière monochromatique et lumière polychromatique. )- Expérience de Newton (642 727). 2)- Expérience avec la lumière émise par un Laser. 3)- Radiation et longueur
REFERENCEMENT NATUREL
REFERENCEMENT NATUREL SEO > définition et enjeux SEA SEO SEO > sommaire Introduction In Page : Off Page : Les critères techniques Les critères éditoriaux Les critères de popularité Les critères de confiance
Séquence 2. Repérage dans le plan Équations de droites. Sommaire
Séquence Repérage dans le plan Équations de droites Sommaire 1 Prérequis Repérage dans le plan 3 Équations de droites 4 Synthèse de la séquence 5 Exercices d approfondissement Séquence MA0 1 1 Prérequis
TEMPÉRATURE DE SURFACE D'UNE ÉTOILE
TEMPÉRATURE DE SURFACE D'UNE ÉTOILE Compétences mises en jeu durant l'activité : Compétences générales : Etre autonome S'impliquer Elaborer et réaliser un protocole expérimental en toute sécurité Compétence(s)
PLAN. Ricco Rakotomalala Tutoriels Tanagra - http://tutoriels-data-mining.blogspot.fr/ 2
Apprentissage non-supervisé ou apprentissage multi-supervisé? Ricco RAKOTOMALALA Tutoriels Tanagra - http://tutoriels-data-mining.blogspot.fr/ PLAN. Classification automatique, typologie, etc.. Interprétation
INF6304 Interfaces Intelligentes
INF6304 Interfaces Intelligentes filtres collaboratifs 1/42 INF6304 Interfaces Intelligentes Systèmes de recommandations, Approches filtres collaboratifs Michel C. Desmarais Génie informatique et génie
Finanzführerschäin. Maison des jeunes Am Quartier
Finanzführerschäin Maison des jeunes Am Quartier 17 mars 2015 Table des matières 1. Qu est-ce qu une transaction? Les notions de «bien» et «service»... 3 2. Qu est-ce qu une dépense? Les notions de besoins
ATELIER SOLUTION. Acheter ou louer? Réforme 2006 de la fiscalité applicable aux véhicules. Avec la collaboration de P.1
ATELIER SOLUTION Acheter ou louer? Réforme 2006 de la fiscalité applicable aux véhicules Avec la collaboration de P.1 Le marché du véhicule d entreprise P.2 La proportion d'entreprises qui financent au
Des solutions complètes Diagnostic des calculateurs et analyse des composants des systèmes moteur par Bosch
Des solutions complètes Diagnostic des calculateurs et analyse des composants des systèmes moteur par Bosch 1 Diagnostic moderne des véhicules avec les solutions complètes Bosch ESI[tronic] 2.0 Logiciel
Le baromètre BforBank - Vague 5 - Présentation globale des résultats Thème abordé : L automobile
Le baromètre BforBank - Vague 5 - Présentation globale des résultats Thème abordé : L automobile Présentation du 22 juin 2011 N Projet : BJ7418 A : BforBank & L Express De : OpinionWay OpinionWay, 06/07/2011
Toutes les unités de moyeu de rechange ne se valent pas. L ignorer peut vous coûter cher en temps, argent et clients perdus.
Toutes les unités de moyeu de rechange ne se valent pas. L ignorer peut vous coûter cher en temps, argent et clients perdus. Les moyeux des première qualité SKF Construits pour égaler ou dépasser les spécifications
Forfait montage 1 PNEU... 3,00. Forfait montage 1 PNEU + ÉQUILIBRAGE 4X4...20,40. Forfait GONFLAGE À L'AZOTE 4 PNEUMATIQUES + ROUE DE SECOURS...
PNEUMATIQUE Forfait motage 1 PNEU... 3,00 Forfait motage 1 PNEU + ÉQUILIBRAGE JANTE TÔLE... à partir de 11,40 Forfait motage 1 PNEU + ÉQUILIBRAGE JANTE ALUMINIUM... à partir de 13,40 Forfait motage 1 PNEU
Pompes à huile et à eau Pierburg. Maintenant également disponibles sur le marché de la rechange
Page 1/6 Pompes à huile et à eau Pierburg Maintenant également disponibles sur le marché de la rechange NEW Motor Service élargit la gamme de pompes à huile et de pompes à eau de la marque KOLBENSCHMIDT
REMBOURSÉS* REMBOURSÉS * SUR VOS PNEUS TTC TTC. Mer : 24 Température : 30 Remise : 80 E. Jusqu à. Jusqu à
Mer : 24 Température : 30 Remise : 80 E 80 e Du 21 juin au 24 juillet 2010 REMBOURSÉS* REMBOURSÉS * SUR VOS PNEUS POUR L ACHAT ET LA POSE DE 4 PNEUS TOURISME OU 4X4 ÉTÉ *Voir conditions en page 3. Et en
Imputation du salaire d ego dans TeO
Imputation du salaire d ego dans TeO Objet de la note : linéariser la réponse en tranche du salaire, et imputer le salaire en cas de non réponse Champ et principe de la méthode Les individus qui se sont
Statistiques. Rappels de cours et travaux dirigés. Master 1 Biologie et technologie du végétal. Année 2010-2011
Master 1 Biologie et technologie du végétal Année 010-011 Statistiques Rappels de cours et travaux dirigés (Seul ce document sera autorisé en examen) auteur : Jean-Marc Labatte [email protected]
Manipulation de données avec SAS Enterprise Guide et modélisation prédictive avec SAS Enterprise Miner
Le cas Orion Star Manipulation de données avec SAS Enterprise Guide et modélisation prédictive avec SAS Enterprise Miner Le cas Orion Star... 1 Manipulation de données avec SAS Enterprise Guide et modélisation
PETITES FAMILIALES ET CABRIOLETS
PETITES FAMILIALES ET CABRIOLETS A ciel ouvert P. Louyet et S. Mestdagh Avec notre premier test de cabriolets, qui vient compléter le test de petites familiales, c'est déjà un avant-goût de vacances. Pour
ESIEA PARIS 2011-2012
ESIEA PARIS 2011-2012 Examen MAT 5201 DATA MINING Mardi 08 Novembre 2011 Première Partie : 15 minutes (7 points) Enseignant responsable : Frédéric Bertrand Remarque importante : les questions de ce questionnaire
ISFA 2 année 2002-2003. Les questions sont en grande partie indépendantes. Merci d utiliser l espace imparti pour vos réponses.
On considère la matrice de données : ISFA 2 année 22-23 Les questions sont en grande partie indépendantes Merci d utiliser l espace imparti pour vos réponses > ele JCVGE FM1 GM JCRB FM2 JMLP Paris 61 29
SAS de base : gestion des données et procédures élémentaires
1 SAS de base : gestion des données et procédures élémentaires SAS de base : gestion des données et procédures élémentaires Résumé Description des commandes (module SAS de base) les plus utiles de l étape
Formation Multimédia
Journées Francophones d Hépato-gastroentérologie et d Oncologie Digestive 2010 Formation Multimédia Smartphone, baladeur MP3, internet : Comment optimiser nos moments perdus pour s autoformer ou accéder
Contactez-nous pour une étude personnalisée ILS ONT CHOISI I CAR DMS. Reconnaissance des constructeurs : Interface avec les réseaux :
ILS ONT CHOISI I CAR DMS Reconnaissance des constructeurs : BMW, CITROËN, FORD MOTOR COMPANY, GENERAL MOTORS EUROPE, (OPEL, SAAB, CHEVROLET), HONDA, NISSAN, PEUGEOT, RENAULT Interface avec les réseaux
SEMINAIRE SAS VISUAL ANALYTICS LAUSANNE, MARCH 18 : JÉRÔME BERTHIER VALERIE AMEEL
SEMINAIRE SAS VISUAL ANALYTICS LAUSANNE, MARCH 18 : JÉRÔME BERTHIER VALERIE AMEEL AGENDA 14:15-14:30 Bienvenue & Introduction Jérôme Berthier et Manuel Fucinos 14:30-14:45 Le concept de la Data Viz et
Comment tracer une droite représentative d'une fonction et méthode de calcul de l'équation d'une droite.
Comment tracer une droite représentative d'une fonction et méthode de calcul de l'équation d'une droite. Introduction : Avant de commencer, il est nécessaire de prendre connaissance des trois types de
La Nissan Leaf 2.0 est élue Grand Prix Auto Environnement
INFORMATION PRESSE Le 22 mai 2013 PRIX AUTO ENVIRONNEMENT MAAF 2013 La Nissan Leaf 2.0 est élue Grand Prix Auto Environnement MAAF Assurances récompense 5 véhicules pour la nouvelle édition du Prix Auto
Du bon usage de gnuplot
Recettes d informatique n bis 99- Du bon usage de gnuplot 1. Utiliser la version 3. de gnuplot : /home3/p/pareuh>gnuplot-3. # démarrer une session du grapheur (version 3.) gnuplot> # en réponse gnuplot>quit
Aide - mémoire gnuplot 4.0
Aide - mémoire gnuplot 4.0 Nicolas Kielbasiewicz 20 juin 2008 L objet de cet aide-mémoire est de présenter les commandes de base pour faire rapidement de très jolis graphiques et courbes à l aide du logiciel
L AIDE AUX ATELIERS D ARTISTES :
RAPPORT DAVID LANGLOIS-MALLET SOUS LA COORDINATION DE CORINNE RUFET, CONSEILLERE REGIONALE D ILE DE FRANCE L AIDE AUX ATELIERS D ARTISTES : PROBLÉMATIQUES INDIVIDUELLES, SOLUTIONS COLLECTIVES? DE L ATELIER-LOGEMENT
LE PARC VEHICULES LEGERS DU CERN. A. Dagan. Résumé
LE PARC VEHICULES LEGERS DU CERN A. Dagan Résumé La création d un parc central de véhicules légers (Car Pool) a été décidée en janvier 1991. Le fonctionnement et l évaluation des coûts du Car Pool sont
The new consumables catalogue from Medisoft is now updated. Please discover this full overview of all our consumables available to you.
General information 120426_CCD_EN_FR Dear Partner, The new consumables catalogue from Medisoft is now updated. Please discover this full overview of all our consumables available to you. To assist navigation
Validation probabiliste d un Système de Prévision d Ensemble
Validation probabiliste d un Système de Prévision d Ensemble Guillem Candille, janvier 2006 Système de Prévision d Ensemble (EPS) (ECMWF Newsletter 90, 2001) Plan 1 Critères de validation probabiliste
Langage SQL : créer et interroger une base
Langage SQL : créer et interroger une base Dans ce chapitre, nous revenons sur les principales requêtes de création de table et d accès aux données. Nous verrons aussi quelques fonctions d agrégation (MAX,
Econométrie et applications
Econométrie et applications Ecole des Ponts ParisTech Département Sciences Economiques Gestion Finance Nicolas Jacquemet ([email protected]) Université Paris 1 & Ecole d Economie de Paris
Didacticiel - Études de cas. Description de quelques fonctions du logiciel PSPP, comparaison des résultats avec ceux de Tanagra, R et OpenStat.
1 Objectif Description de quelques fonctions du logiciel PSPP, comparaison des résultats avec ceux de Tanagra, R et OpenStat. Tout le monde l aura compris, je passe énormément de temps à analyser les logiciels
Module HVAC - fonctionnalités
Module HVAC - fonctionnalités Modèle de radiation : DO = Discrete Ordinates On peut considérer l échauffement de solides semi transparents causé par le rayonnement absorbé par le solide. On peut également
Souad EL Bernoussi. Groupe d Analyse Numérique et Optimisation Rabat http ://www.fsr.ac.ma/ano/
Recherche opérationnelle Les démonstrations et les exemples seront traités en cours Souad EL Bernoussi Groupe d Analyse Numérique et Optimisation Rabat http ://www.fsr.ac.ma/ano/ Table des matières 1 Programmation
Chapitre 3. Les distributions à deux variables
Chapitre 3. Les distributions à deux variables Jean-François Coeurjolly http://www-ljk.imag.fr/membres/jean-francois.coeurjolly/ Laboratoire Jean Kuntzmann (LJK), Grenoble University 1 Distributions conditionnelles
Le 1 er média professionnel automobile* * Sur la base de 20.000 visiteurs uniques sur le site autobiz.fr. Source : doubleclick.com, janvier 2011.
Le 1 er média professionnel automobile* * Sur la base de 20.000 visiteurs uniques sur le site autobiz.fr. Source : doubleclick.com, janvier 2011. autobiz est le leader de l information de marché sur le
Nouvelle approche de validation Novo Nordisk
44 ème Congrès International SFSTP 6 et 7 juin 2012 LA CONNAISSANCE SCIENTIFIQUE AU SERVICE DE LA QUALITE PRODUIT Apports du «Quality by Design» et retours d expd expériences Nouvelle approche de validation
PHOTO PLAISIRS. La Lumière Température de couleur & Balance des blancs. Mars 2011 Textes et Photos de Bruno TARDY 1
PHOTO PLAISIRS La Lumière Température de couleur & Balance des blancs Mars 2011 Textes et Photos de Bruno TARDY 1 Blanc Infrarouge Flash Température Lumière RVB Couleur chaude Couleur Couleur Couleur Incandescente
Approche par groupe de gènes pour les données longitudinales d expression génique avec une application dans un essai vaccinal contre le VIH
Approche par groupe de gènes pour les données longitudinales d expression génique avec une application dans un essai vaccinal contre le VIH Boris Hejblum 1,2,3 & Rodolphe Thiébaut 1,2,3 1 Inserm, U897
FONCTIONS DE PLUSIEURS VARIABLES (Outils Mathématiques 4)
FONCTIONS DE PLUSIEURS VARIABLES (Outils Mathématiques 4) Bernard Le Stum Université de Rennes 1 Version du 13 mars 2009 Table des matières 1 Fonctions partielles, courbes de niveau 1 2 Limites et continuité
La Recherche du Point Optimum de Fonctionnement d un Générateur Photovoltaïque en Utilisant les Réseaux NEURO-FLOUS
Rev. Energ. Ren. : Chemss 2000 39-44 La Recherche du Point Optimum de Fonctionnement d un Générateur Photovoltaïque en Utilisant les Réseaux NEURO-FLOUS D.K. Mohamed, A. Midoun et F. Safia Département
Exo7. Calculs de déterminants. Fiche corrigée par Arnaud Bodin. Exercice 1 Calculer les déterminants des matrices suivantes : Exercice 2.
Eo7 Calculs de déterminants Fiche corrigée par Arnaud Bodin Eercice Calculer les déterminants des matrices suivantes : Correction Vidéo ( ) 0 6 7 3 4 5 8 4 5 6 0 3 4 5 5 6 7 0 3 5 4 3 0 3 0 0 3 0 0 0 3
SAV ET RÉPARATION. Savoir-faire. www.jarltech.fr
i & V : SA E b i i 1 3 2 0 1 Ai 0800 9 h P i iè P i i i i S j C i Si E ) i Ti (i ib i Q,. bq i, FA V k, Pi b h iè i Si b, D Z, P E q Si-i SAV ET RÉPARATION S hiq : E q SSII VAR, i hiq Jh i h 0800 910 231.
Cryptographie RSA. Introduction Opérations Attaques. Cryptographie RSA NGUYEN Tuong Lan - LIU Yi 1
Cryptographie RSA Introduction Opérations Attaques Cryptographie RSA NGUYEN Tuong Lan - LIU Yi 1 Introduction Historique: Rivest Shamir Adleman ou RSA est un algorithme asymétrique de cryptographie à clé
Akka Technologies au service de la voiture électrique - Cartech.fr
1 sur 5 30/08/2010 12:40 508 peugeot Accueil News & blogs Produits Shopping Telecharger forum Cartech Inscription CNET France Forums Infotrafic Environnement Technologies embarquées Concept-car Accessoires
w w w. a u t o m o b i l e - e n t r e p r i s e. c o m
RejoIgnez le n 1 de la gestion de flotte automobile w w w. a u t o m o b i l e - e n t r e p r i s e. c o m MéDIA 2015 le MAgAzIne la CIble Responsables de parc Services techniques Directeurs administratifs
Ricco.Rakotomalala http://eric.univ-lyon2.fr/~ricco/cours
Ricco.Rakotomalala http://eric.univ-lyon2.fr/~ricco/cours Références : 1. G. Saporta, «Probabilités, Analyse de données et Statistique», Dunod, 2006 ; partie théorique, pages 155 à 177 ; partie pratique,
Grégoire de Lassence. Copyright 2006, SAS Institute Inc. All rights reserved.
Grégoire de Lassence 1 Grégoire de Lassence Responsable Pédagogie et Recherche Département Académique Tel : +33 1 60 62 12 19 [email protected] http://www.sas.com/france/academic SAS dans
Démonstration de la conjecture de Dumont
C. R. Acad. Sci. Paris, Ser. I 1 (005) 71 718 Théorie des nombres/combinatoire Démonstration de la conjecture de Dumont Bodo Lass http://france.elsevier.com/direct/crass1/ Institut Camille Jordan, UMR
Comprendre l impact de l utilisation des réseaux sociaux en entreprise SYNTHESE DES RESULTATS : EUROPE ET FRANCE
Comprendre l impact de l utilisation des réseaux sociaux en entreprise SYNTHESE DES RESULTATS : EUROPE ET FRANCE 1 Objectifs de l étude Comprendre l impact des réseaux sociaux externes ( Facebook, LinkedIn,
TESTS PORTMANTEAU D ADÉQUATION DE MODÈLES ARMA FAIBLES : UNE APPROCHE BASÉE SUR L AUTO-NORMALISATION
TESTS PORTMANTEAU D ADÉQUATION DE MODÈLES ARMA FAIBLES : UNE APPROCHE BASÉE SUR L AUTO-NORMALISATION Bruno Saussereau Laboratoire de Mathématiques de Besançon Université de Franche-Comté Travail en commun
Corrigé du baccalauréat S Asie 21 juin 2010
Corrigé du baccalauréat S Asie juin 00 EXERCICE Commun à tous les candidats 4 points. Question : Le triangle GBI est : Réponse a : isocèle. Réponse b : équilatéral. Réponse c : rectangle. On a GB = + =
Programmation linéaire
1 Programmation linéaire 1. Le problème, un exemple. 2. Le cas b = 0 3. Théorème de dualité 4. L algorithme du simplexe 5. Problèmes équivalents 6. Complexité de l Algorithme 2 Position du problème Soit
Statistique Descriptive Multidimensionnelle. (pour les nuls)
Publications de l Institut de Mathématiques de Toulouse Statistique Descriptive Multidimensionnelle (pour les nuls) (version de mai 2010) Alain Baccini Institut de Mathématiques de Toulouse UMR CNRS 5219
