Analyse en composantes principales
|
|
- Diane Yvette Lamontagne
- il y a 6 ans
- Total affichages :
Transcription
1 5MS04 - Analyse des données Master 2 spécialité Statistiques Université Pierre et Marie Curie Analyse en composantes principales et une courte introduction à l analyse des correspondances Bertrand MICHEL bertrand.michel@ec-nantes.fr
2 La décomposition en valeurs singulières Singular Value Decomposition (SVD) Théorème 1. Pour X M(n, D) de rang r, il existe : des réels positifs µ 1 µ r > 0, une famille orthonormée U = [u 1,..., u r ] de R D, une famille orthonormée V = [v 1,..., v r ] de R n tels que X = V Diag(µ 1,..., µ r )U = µ s v s u s. s=1...r De plus, pour tout d r, la matrice X d = s=1...d µ sv s u s vérifie : X X d F = min X B F = µ 2 s B M n,d rang(b)=d s=d+1...r où F est la norme de Frobenius : M 2 F = i,j M 2 i,j = Tr(M M)
3 La décomposition en valeurs singulières Singular Value Decomposition (SVD) Diagonalisation de la matrice de covariance via la SVD de X : ns = X X = µ 2 su s u s s=1...r et les u s sont des vecteurs propres (normés) de la matrice X X relatifs aux valeurs propres µ 2 1,..., µ 2 r. Diagonalisation de la matrice de Gram via la SVD de X : G = XX = µ 2 sv s (v s ) s=1...r et les v s sont des vecteurs propres (normés) de la matrice XX relatifs aux valeurs propres µ 2 1,..., µ 2 r. Dualité entre les deux problèmes Xu s = µ s v s et X v s = µ s u s.
4 Dans la suite, on suppose que la matrice de données X a été préalablement centrée : x = 0. ACP : position du problème Individus x 1,..., x i,..., x n en lignes, Variables quantitatives numériques x 1,..., x j,..., x D en colonnes. x x D 1... x 1 n... x D n L ACP : méthode d exploration des données qui vise : La représentation graphique des variables dans un sous-espace explicitant au mieux les liaisons entre les variables ; La représentation graphique optimale des individus dans un sous-espace de dimension q de R D, en déformant le moins possible le nuage de points initial ; La réduction de dimension, la compression de données.
5 ACP : Nuages de X et métriques La matrice de X définit deux nuages : N ind : le nuage des points individus dans R D. N var : le nuage des points variables dans R n. Pour résumer les données, on cherche pour un entier d fixé : le s.e.v. E d de dim. d dans R D qui s ajuste le mieux sur N ind, le s.e.v. F d de dim. d dans R n qui s ajuste le mieux sur N var. Métriques choisies : R D est muni du produit scalaire usuel : < x i, x l >= j=1...d xj i xj l R n est muni du produit scalaire des poids tous égaux : < x j, x k > n := 1 n On note n la norme associée. i=1...n x j i xk i.
6 ACP : Nuages de X et métriques Grâce au recentrage de la matrice X et au choix de p.s. dans R n : < x j, x k > n = 1 n (xj ) x k = cov(x j, x k ) = cor(x j, x k ) pour l ACP normée x j x k 2 n = var x j + var x k 2 cov(x j, x k ) [ ] = 2 1 cor(x j, x k ) pour l ACP normée En ACP normée, la distance entre variables s interprète en terme de colinéarité :
7 ACP : inertie du nuage des individus L inertie généralise la notion de dispersion pour un nuage de points (individus) dans R D : I(X) := 1 n i=1...n x i 2 = 1 n X F = 1 n tr(xx ) = tr(s) Dans l espace des variables (R n, n ), on définit l inertie d un nuage par D I (N var ) := x j 2 n On a bien I (N var ) = I (N ind ) j=1
8 ACP : Ajustement d un sous-espace vectoriel sur N ind On cherche un s.e.v. E d de R D qui approche au mieux le nuage N ind pour la norme usuelle. Par Pythagore : D où : Minimiser 1 n x i 2 = x i P Ed (x i ) 2 + P Ed (x i ) 2 i=1...n ( ) x i P Ed (x i ) 2 Maximiser I PEd (N ind) On considère la décomposition en valeurs singulières de X : X := µ s v s u s. s=1...r L inertie de la projection orthogonale de N ind sur un s.e.v. E d est maximale pour Êd := Vect(u 1,..., u d ). De façon équivalente : l ajustement sur le nuage de points N ind est optimal pour Êd.
9 ACP : Ajustement d un sous espace vectoriel sur N var On cherche cette fois un s.e.v. F d de R n qui approche au mieux le nuage N var pour la norme n. Par Pythagore : D où Minimiser x j 2 n = x j P Fd (x j ) 2 n + P Fd (x j ) 2 n j=1...d ( ) x j P Fd (x j ) 2 n Maximiser I PEd (N var) On considère la SVD de X : X := r µ s v s u s. s=1 L ajustement sur N var est optimal pour ˆF d := Vect(v 1,..., v d ). Attention : v s 2 n = 1 n, on définit donc ṽs = nv s et ṽ s 2 n = 1.
10 ACP : solutions et dualité des deux problèmes d ajustement Dans R D : les vecteurs propres de S = 1 n X X sont les u s pour les valeurs propres λ s := 1 n µ2 s : Su s = 1 n X Xu s = 1 n µ2 su s. Dans R n : les vecteurs propres de la matrice de Gram XX sont les v s pour les valeurs propres µ 2 s : XX v s = µ 2 sv s. En général n > D et la solution la moins coûteuse algorithmiquement est de passer par la diagonalisation de S.
11 ACP : solutions et dualité des deux problèmes d ajustement Par la SVD de X : Xu s = µ s v s et X v s = µ s u s. Composantes principales : coordonnées des projections des points individus sur l axe factoriel porté par u s : Ψ s := < x 1, u s >. < x n, u s > = Xu s = µ s v s = λ s ṽ s. Coordonnées des projections des variables sur l axe factoriel porté par v s ou ṽ s : Φ s := < x 1, ṽ s > n. < x p, ṽ s > n = 1 n X ṽ s = 1 n X v s = λ s u s.
12 ACP : Bilan de l ACP
13 ACP : Bilan de l ACP On dispose initialement d un tableau de données brutes R = (r ij ) de taille n D. On distingue 2 types d analyse en composantes principales (ACP) : l ACP non normée : analyse du tableau centré X = R r ; l ACP normée : analyse du tableau centré réduit X = ( r j i rj var(r j ) ). i,j Trouver des projections des nuages N ind et N var sur des sous-espaces vectoriels de dimensions inférieures, qui conservent un maximum d information c est-à-dire d inertie, conduit à considérer la décomposition en valeurs singulières de X : X := r µ s v s u s. s=1
14 ACP : Bilan de l ACP X := r µ s v s u s s=1 Les vecteurs u s sont les vecteurs propres de S pour les valeurs propres λ s := 1 n µ2 s et on peut d ailleurs les déterminer de cette façon. On peut ensuite trouver les v s grâce à la relation Xu s = µ s v s. La solution de l ACP est finalement donnée par la projection du nuage N ind sur Êd := Vect(u 1,..., u d ), la projection du nuage N var sur ˆF d := Vect(v 1,..., v d ). Les coordonnées des projections des individus sur le s-ième axe factoriel se lisent dans le vecteur Ψ s = λ s v s. De même, les coordonnées des projections des variables sur le s-ième axe factoriel se lisent dans le vecteur Φ s = λ s u s. L ACP est une projection orthogonale bien choisie, il s agit donc d une méthode de réduction de dimension de type linéaire.
15 Une seconde formulation du problème de l ACP On a défini la s-ième composante principale comme le vecteur des coordonnées des points individus x i sur l axe factoriel dirigé par u s. On a Ψ s = Xu s = λ s ṽ s et le vecteur Ψ s R n peut aussi être considéré comme une variable. Proposition 1. Les composantes principales sont orthogonales (ou non corrélées) deux à deux : cov(ψ s, Ψ t ) = λ s δ s,t En particulier, var(ψ s ) = µ2 s n = λ s.
16 Une seconde formulation du problème de l ACP Seconde formulation du problème de l ACP : on cherche une famille de nouvelles variables ( Ψ s ) s=1,...,d de R n telle que : chaque Ψ s soit une combinaison linéaire des x j : Ψ s = Xα s avec α s = 1 ; les Ψ s ne soient pas corrélés entre eux : cov( Ψ s, Ψ t ) = 0 si s t ; les variances var( Ψ s ) soient maximales (d où la contrainte α s = 1). Proposition 2. Les composantes principales Ψ s sont solutions (pour α s = u s ) de cette seconde formulation du problème de l ACP.
17 Une seconde formulation du problème de l ACP Cette seconde approche montre bien que la matrice de variance-covariance S de X permet de décrire la géométrie du nuage des individus. En effet, les facteurs u s sont les vecteurs propres normés de S et sont tels que : les facteurs u s sont dirigés dans R n dans les directions où le nuage est le plus étalé, les facteurs u s sont orthogonaux, la dispersion des données dans ces directions est mesurée par les valeurs propres de S : var(ψ s ) = var(xu s ) = λ s.
18 Pratique de l ACP : plans factoriels On analyse le nuage des individus en projetant ces derniers sur les premières directions factorielles : Ces représentations permettent de résumer de façon optimale la géométrie du nuage. Elles permettent aussi de déceler d éventuels outliers, que l on pourra alors retirer des données pour procéder à une nouvelle ACP.
19 Pratique de l ACP (cf TPs) 2D-proj : left-right pose 3D-proj : light 2D-proj : up-down pose
20 Pratique de l ACP : qualité de la représentation L inertie du nuage peut aussi être décomposée de la façon suivante : I (N ind ) = tr(s) = λ λ D = λ λ r car λ s = 0 pour s > r = D pour l ACP normée La qualité globale de la représentation pour une projection sur Êd se mesure par le ratio d inertie conservé par la projection : ratio d := I ( P Êd (N ind ) ) = λ λ d. I(N ind ) λ λ r La qualité de la représentation de l individu x i projeté sur Êd peut être mesurée par le cosinus carré suivant : cos 2 [ θ(x i, P Êd x i ) ] = PÊ d x i 2 x i 2 = d s=1 (Ψs i )2 r s=1 (Ψs i )2.
21 Pratique de l ACP : contributions des individus L inertie du nuage peut aussi être décomposée de la façon suivante : I (N ind ) = λ λ p = 1 n x i 2 = 1 n r (Ψ s i ) 2. n n i=1 i=1 s=1 La contribution de l individu i à l inertie totale du nuage vaut 1 n γ i = x i 2 1 r I (N ind ) = n s=1 (Ψs i )2. λ λ p Puisque var(ψ s ) = λ s = 1 n n (Ψ s i ) 2, la contribution de l individu i à la variance de la s-ième composante principale vaut 1 n γ i s = (Ψs i )2. λ s i=1
22 On peut aussi calculer comme précédemment la qualité de la représentation de z. Pratique de l ACP : Représentation d individus supplémentaires On appelle individu supplémentaire tout individu qui n a pas été pris en compte pour le calcul de l ACP (i.e. pour la diagonalisation de S). On peut représenter des individus supplémentaires en les projetant dans les plans factoriels. Soit z un tel individu, on recentre z : z = z x (et on réduit dans le cas de l ACP normé). Les coordonnées de la projection de z sur chacun des axes factoriels valent Ψ s z := u s z.
23 Pratique de l ACP : Cercle des corrélations On analyse le nuage des variables en projetant ces dernières sur les premières directions factorielles : Dans le cas de l ACP normée, on a x j 2 n = 1 pour tous les j et la projection des individus sur tout plan factoriel (ṽ s, ṽ t ) est nécessairement à l intérieur du cercle.
24 Coordonnées des variables projetées et corrélation Rappel : Φ s = ( ) Φ 1 s,..., Φ D s est le vecteur des coordonnées de chacune des D variables sur le s-ième axe factoriel dirigé par ṽ s ; on a φ j s = 1 n ( x j ) ṽs = cov(x j, ṽ s ) = cor(x j, ṽ s ) pour l ACP normée L inertie du nuage des variables projetées sur F d se décompose alors de la façon suivante : I ( ) D PˆFd N var = var(x j ) [cor(x j, ṽ 1 ) cor(x j, ṽ d ) 2] = j=1 D cor(x j, ṽ 1 ) cor(x j, ṽ d ) 2 j=1 ACP normée Comme pour l analyse du nuage des individus, on définit des indicateurs pour mesurer la qualité des représentations ainsi que les contributions de chacune des variables.
25 Qualité de la représentation des variables (ACP normée) La qualité de la représentation de la variable x j projetée sur ˆF q vaut cos 2 [ θ(x j, PˆFq xj ) ] = PÊ qx j 2 n x j 2 n = q s=1 ( cor(x j, ṽ s ) ) 2 r s=1 (cor(xj, ṽ s )) 2. la variable x 1 est bien représentée, elle très corrélée avec ṽ 1 (ou Ψ 1 ), peu avec ṽ 2 (ou Ψ 2 ). la variable x 2 est bien représentée, elle très corrélée avec ṽ 2 (ou Ψ 2 ), peu avec ṽ 1 (ou Ψ 1 ). la variable x 3 est mal représentée dans ce plan factoriel, elle est peu corrélée avec ṽ 1 et v 2.
26 Si les variables sont de type catégoriel Avec l ACP : on peut représenter une variable catégorielle en projetant les barycentres des sous-nuages (une modalité de la variable = un sous-nuage) sur chacun des axes factoriels. Cependant, les variables catégorielles ne sont alors que des variables illustratives. Autrement dit, elles n entrent pas en jeu dans la formation des composantes principales.
27 L analyse factorielle des correspondances (AFC) L AFC est une ACP sur un tableau de contingence (2 variables catégorielles). L AFC est un raffinement du test du χ 2. On étudie l AFC sur un exemple. Données : Nombre de médailles obtenues aux JO sur 5 olympiades (1992 à 2008) Pays Tableau de contingence : alg aus bah bar bdi blr bra brn can chn cub cze den 10000m m mH m m km mSteeple m mH x100m x400m m km m Decathlon
28 L analyse factorielle des correspondances (AFC) Le test d indépendance du χ 2. Soient Y et Z à valeurs dans {y 1,..., y L } et {z 1,..., z H }. On observe un n-échantillon de (Y, Z). Pour l {1..., L} et h {1..., H}, on définit N l, = card {i; Y i = y l }, N,h = card {i; Z i = z h }, N l,h = card {i; y i = y l, Z i = z h }. La matrice des N l,h est le tableau de contingence des observations de (Y, Z). Sous l hypothèse d indépendance, on s attend à ce que les proportions observées vérifient N,h f l,h := N l,h n N l, n n =: f l, f,h. Stat du test du χ 2 : Φ 2 := n (f l,h f l, f,h ) 2 l=1...l h=1...h f l, f,h. Sous hypothèse d indépendance, Φ 2 χ 2 ((H 1)(L 1)).
29 L analyse factorielle des correspondances (AFC) L AFC résumée en 4 points : on considère ( le nuage des profils lignes fl,1,..., f ) l,h,... pour la ligne l f l, f l, On introduit la métrique du χ 2 entre profils lignes : H ( 1 fi,h d χ 2(i, l) := f ) 2 l,h. f,h f i, f l, h=1 L inertie (pondérée) associée vérifie f l, d χ 2(G H, l) = nφ 2 l=1...l où G H est le profil moyen des colonnes. de même pour le nuage des profils colonnes. La solution de l ACP (i.e. la recherche d axes orthogonaux d inertie max) est donnée par une SVD de la matrice des profils centrés (pour d χ 2).
30 L analyse factorielle des correspondances (AFC)
31 L analyse des correspondances multiples L analyse des composantes multiples permet de traiter le cas de p variables catégorielles. En bref : On considère le tableau disjonctif complet. On définit une distance adéquate entre modalités ainsi qu une distance entre individus. On résout l ACP correspondante. On projette sur les plans factoriels toutes les modalités de toutes les variables.
1 Complément sur la projection du nuage des individus
TP 0 : Analyse en composantes principales (II) Le but de ce TP est d approfondir nos connaissances concernant l analyse en composantes principales (ACP). Pour cela, on reprend les notations du précédent
Plus en détailL ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ
L ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ INTRODUCTION Données : n individus observés sur p variables quantitatives. L A.C.P. permet d eplorer les liaisons entre variables et
Plus en détailAnalyse en Composantes Principales
Analyse en Composantes Principales Anne B Dufour Octobre 2013 Anne B Dufour () Analyse en Composantes Principales Octobre 2013 1 / 36 Introduction Introduction Soit X un tableau contenant p variables mesurées
Plus en détailINTRODUCTION À L ANALYSE FACTORIELLE DES CORRESPONDANCES
INTRODUCTION À L ANALYSE FACTORIELLE DES CORRESPONDANCES Dominique LAFFLY Maître de Conférences, Université de Pau Laboratoire Société Environnement Territoire UMR 5603 du CNRS et Université de Pau Domaine
Plus en détailStatistique Descriptive Multidimensionnelle. (pour les nuls)
Publications de l Institut de Mathématiques de Toulouse Statistique Descriptive Multidimensionnelle (pour les nuls) (version de mai 2010) Alain Baccini Institut de Mathématiques de Toulouse UMR CNRS 5219
Plus en détailMAP 553 Apprentissage statistique
MAP 553 Apprentissage statistique Université Paris Sud et Ecole Polytechnique http://www.cmap.polytechnique.fr/~giraud/map553/map553.html PC1 1/39 Apprentissage? 2/39 Apprentissage? L apprentissage au
Plus en détailIntroduction. Préambule. Le contexte
Préambule... INTRODUCTION... BREF HISTORIQUE DE L ACP... 4 DOMAINE D'APPLICATION... 5 INTERPRETATIONS GEOMETRIQUES... 6 a - Pour les n individus... 6 b - Pour les p variables... 7 c - Notion d éléments
Plus en détailLa classification automatique de données quantitatives
La classification automatique de données quantitatives 1 Introduction Parmi les méthodes de statistique exploratoire multidimensionnelle, dont l objectif est d extraire d une masse de données des informations
Plus en détailDéroulement d un projet en DATA MINING, préparation et analyse des données. Walid AYADI
1 Déroulement d un projet en DATA MINING, préparation et analyse des données Walid AYADI 2 Les étapes d un projet Choix du sujet - Définition des objectifs Inventaire des données existantes Collecte, nettoyage
Plus en détailAnalyse des correspondances avec colonne de référence
ADE-4 Analyse des correspondances avec colonne de référence Résumé Quand une table de contingence contient une colonne de poids très élevé, cette colonne peut servir de point de référence. La distribution
Plus en détailProgrammation linéaire
1 Programmation linéaire 1. Le problème, un exemple. 2. Le cas b = 0 3. Théorème de dualité 4. L algorithme du simplexe 5. Problèmes équivalents 6. Complexité de l Algorithme 2 Position du problème Soit
Plus en détailFormes quadratiques. 1 Formes quadratiques et formes polaires associées. Imen BHOURI. 1.1 Définitions
Formes quadratiques Imen BHOURI 1 Ce cours s adresse aux étudiants de niveau deuxième année de Licence et à ceux qui préparent le capes. Il combine d une façon indissociable l étude des concepts bilinéaires
Plus en détailExercice : la frontière des portefeuilles optimaux sans actif certain
Exercice : la frontière des portefeuilles optimaux sans actif certain Philippe Bernard Ingénierie Economique & Financière Université Paris-Dauphine Février 0 On considère un univers de titres constitué
Plus en détailChapitre 3. Les distributions à deux variables
Chapitre 3. Les distributions à deux variables Jean-François Coeurjolly http://www-ljk.imag.fr/membres/jean-francois.coeurjolly/ Laboratoire Jean Kuntzmann (LJK), Grenoble University 1 Distributions conditionnelles
Plus en détailDifférentiabilité ; Fonctions de plusieurs variables réelles
Différentiabilité ; Fonctions de plusieurs variables réelles Denis Vekemans R n est muni de l une des trois normes usuelles. 1,. 2 ou.. x 1 = i i n Toutes les normes de R n sont équivalentes. x i ; x 2
Plus en détail3 Approximation de solutions d équations
3 Approximation de solutions d équations Une équation scalaire a la forme générale f(x) =0où f est une fonction de IR dans IR. Un système de n équations à n inconnues peut aussi se mettre sous une telle
Plus en détailChapitre 7. Statistique des échantillons gaussiens. 7.1 Projection de vecteurs gaussiens
Chapitre 7 Statistique des échantillons gaussiens Le théorème central limite met en évidence le rôle majeur tenu par la loi gaussienne en modélisation stochastique. De ce fait, les modèles statistiques
Plus en détailExtraction d informations stratégiques par Analyse en Composantes Principales
Extraction d informations stratégiques par Analyse en Composantes Principales Bernard DOUSSET IRIT/ SIG, Université Paul Sabatier, 118 route de Narbonne, 31062 Toulouse cedex 04 dousset@irit.fr 1 Introduction
Plus en détailPEUT-ON «VOIR» DANS L ESPACE À N DIMENSIONS?
PEUT-ON «VOIR» DANS L ESPACE À N DIMENSIONS? Pierre Baumann, Michel Émery Résumé : Comment une propriété évidente visuellement en dimensions deux et trois s étend-elle aux autres dimensions? Voici une
Plus en détailApprentissage Automatique
Apprentissage Automatique Introduction-I jean-francois.bonastre@univ-avignon.fr www.lia.univ-avignon.fr Définition? (Wikipedia) L'apprentissage automatique (machine-learning en anglais) est un des champs
Plus en détailCalcul intégral élémentaire en plusieurs variables
Calcul intégral élémentaire en plusieurs variables PC*2 2 septembre 2009 Avant-propos À part le théorème de Fubini qui sera démontré dans le cours sur les intégrales à paramètres et qui ne semble pas explicitement
Plus en détailAlgorithmes pour la planification de mouvements en robotique non-holonome
Algorithmes pour la planification de mouvements en robotique non-holonome Frédéric Jean Unité de Mathématiques Appliquées ENSTA Le 02 février 2006 Outline 1 2 3 Modélisation Géométrique d un Robot Robot
Plus en détailActivités numériques [13 Points]
N du candidat L emploi de la calculatrice est autorisé. Le soin, la qualité de la présentation entrent pour 2 points dans l appréciation des copies. Les résultats seront soulignés. La correction est disponible
Plus en détailAnalyses multivariées avec R Commander (via le package FactoMineR) Qu est ce que R? Introduction à R Qu est ce que R?
Analyses multivariées avec R Commander Analyses multivariées avec R Commander (via le package FactoMineR) Plate-forme de Support en Méthodologie et Calcul Statistique (SMCS) - UCL 1 Introduction à R 2
Plus en détailFONCTIONS DE PLUSIEURS VARIABLES (Outils Mathématiques 4)
FONCTIONS DE PLUSIEURS VARIABLES (Outils Mathématiques 4) Bernard Le Stum Université de Rennes 1 Version du 13 mars 2009 Table des matières 1 Fonctions partielles, courbes de niveau 1 2 Limites et continuité
Plus en détailI. Polynômes de Tchebychev
Première épreuve CCP filière MP I. Polynômes de Tchebychev ( ) 1.a) Tout réel θ vérifie cos(nθ) = Re ((cos θ + i sin θ) n ) = Re Cn k (cos θ) n k i k (sin θ) k Or i k est réel quand k est pair et imaginaire
Plus en détailLogiciel XLSTAT version 7.0. 40 rue Damrémont 75018 PARIS
Logiciel XLSTAT version 7.0 Contact : Addinsoft 40 rue Damrémont 75018 PARIS 2005-2006 Plan Présentation générale du logiciel Statistiques descriptives Histogramme Discrétisation Tableau de contingence
Plus en détailCours d Analyse. Fonctions de plusieurs variables
Cours d Analyse Fonctions de plusieurs variables Licence 1ère année 2007/2008 Nicolas Prioux Université de Marne-la-Vallée Table des matières 1 Notions de géométrie dans l espace et fonctions à deux variables........
Plus en détailQuelques contrôle de Première S
Quelques contrôle de Première S Gilles Auriol auriolg@free.fr http ://auriolg.free.fr Voici l énoncé de 7 devoirs de Première S, intégralement corrigés. Malgré tout les devoirs et 5 nécessitent l usage
Plus en détailRésolution de systèmes linéaires par des méthodes directes
Résolution de systèmes linéaires par des méthodes directes J. Erhel Janvier 2014 1 Inverse d une matrice carrée et systèmes linéaires Ce paragraphe a pour objet les matrices carrées et les systèmes linéaires.
Plus en détailLe modèle de Black et Scholes
Le modèle de Black et Scholes Alexandre Popier février 21 1 Introduction : exemple très simple de modèle financier On considère un marché avec une seule action cotée, sur une période donnée T. Dans un
Plus en détailLa programmation linéaire : une introduction. Qu est-ce qu un programme linéaire? Terminologie. Écriture mathématique
La programmation linéaire : une introduction Qu est-ce qu un programme linéaire? Qu est-ce qu un programme linéaire? Exemples : allocation de ressources problème de recouvrement Hypothèses de la programmation
Plus en détailSTATIQUE GRAPHIQUE ET STATIQUE ANALYTIQUE
ÉCOLE D'INGÉNIEURS DE FRIBOURG (E.I.F.) SECTION DE MÉCANIQUE G.R. Nicolet, revu en 2006 STATIQUE GRAPHIQUE ET STATIQUE ANALYTIQUE Eléments de calcul vectoriel Opérations avec les forces Equilibre du point
Plus en détailRelation entre deux variables : estimation de la corrélation linéaire
CHAPITRE 3 Relation entre deux variables : estimation de la corrélation linéaire Parmi les analyses statistiques descriptives, l une d entre elles est particulièrement utilisée pour mettre en évidence
Plus en détailL'analyse des données à l usage des non mathématiciens
Montpellier L'analyse des données à l usage des non mathématiciens 2 ème Partie: L'analyse en composantes principales AGRO.M - INRA - Formation Permanente Janvier 2006 André Bouchier Analyses multivariés.
Plus en détailLe Modèle Linéaire par l exemple :
Publications du Laboratoire de Statistique et Probabilités Le Modèle Linéaire par l exemple : Régression, Analyse de la Variance,... Jean-Marc Azaïs et Jean-Marc Bardet Laboratoire de Statistique et Probabilités
Plus en détailI. Introduction. 1. Objectifs. 2. Les options. a. Présentation du problème.
I. Introduction. 1. Objectifs. Le but de ces quelques séances est d introduire les outils mathématiques, plus précisément ceux de nature probabiliste, qui interviennent dans les modèles financiers ; nous
Plus en détailSouad EL Bernoussi. Groupe d Analyse Numérique et Optimisation Rabat http ://www.fsr.ac.ma/ano/
Recherche opérationnelle Les démonstrations et les exemples seront traités en cours Souad EL Bernoussi Groupe d Analyse Numérique et Optimisation Rabat http ://www.fsr.ac.ma/ano/ Table des matières 1 Programmation
Plus en détailOn ne peut pas entendre la forme d un tambour
On ne peut pas entendre la forme d un tambour Pierre Bérard Institut Fourier Laboratoire de Mathématiques Unité Mixte de Recherche 5582 CNRS UJF Université Joseph Fourier, Grenoble 1 Introduction 1.1 Position
Plus en détailUne comparaison de méthodes de discrimination des masses de véhicules automobiles
p.1/34 Une comparaison de méthodes de discrimination des masses de véhicules automobiles A. Rakotomamonjy, R. Le Riche et D. Gualandris INSA de Rouen / CNRS 1884 et SMS / PSA Enquêtes en clientèle dans
Plus en détailPolynômes à plusieurs variables. Résultant
Polynômes à plusieurs variables. Résultant Christophe Ritzenthaler 1 Relations coefficients-racines. Polynômes symétriques Issu de [MS] et de [Goz]. Soit A un anneau intègre. Définition 1.1. Soit a A \
Plus en détailProgrammes des classes préparatoires aux Grandes Ecoles
Programmes des classes préparatoires aux Grandes Ecoles Filière : scientifique Voie : Biologie, chimie, physique et sciences de la Terre (BCPST) Discipline : Mathématiques Seconde année Préambule Programme
Plus en détailPremière partie. Préliminaires : noyaux itérés. MPSI B 6 juin 2015
Énoncé Soit V un espace vectoriel réel. L espace vectoriel des endomorphismes de V est désigné par L(V ). Lorsque f L(V ) et k N, on désigne par f 0 = Id V, f k = f k f la composée de f avec lui même k
Plus en détailContinuité et dérivabilité d une fonction
DERNIÈRE IMPRESSIN LE 7 novembre 014 à 10:3 Continuité et dérivabilité d une fonction Table des matières 1 Continuité d une fonction 1.1 Limite finie en un point.......................... 1. Continuité
Plus en détailCours de mathématiques
DEUG MIAS premier niveau Cours de mathématiques année 2003/2004 Guillaume Legendre (version révisée du 3 avril 2015) Table des matières 1 Éléments de logique 1 1.1 Assertions...............................................
Plus en détailFonctions de plusieurs variables
Module : Analyse 03 Chapitre 00 : Fonctions de plusieurs variables Généralités et Rappels des notions topologiques dans : Qu est- ce que?: Mathématiquement, n étant un entier non nul, on définit comme
Plus en détailProgrammation linéaire et Optimisation. Didier Smets
Programmation linéaire et Optimisation Didier Smets Chapitre 1 Un problème d optimisation linéaire en dimension 2 On considère le cas d un fabricant d automobiles qui propose deux modèles à la vente, des
Plus en détailDistribution Uniforme Probabilité de Laplace Dénombrements Les Paris. Chapitre 2 Le calcul des probabilités
Chapitre 2 Le calcul des probabilités Equiprobabilité et Distribution Uniforme Deux événements A et B sont dits équiprobables si P(A) = P(B) Si il y a équiprobabilité sur Ω, cad si tous les événements
Plus en détailCorrection du Baccalauréat S Amérique du Nord mai 2007
Correction du Baccalauréat S Amérique du Nord mai 7 EXERCICE points. Le plan (P) a une pour équation cartésienne : x+y z+ =. Les coordonnées de H vérifient cette équation donc H appartient à (P) et A n
Plus en détailLA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING»
LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING» Gilbert Saporta Professeur de Statistique Appliquée Conservatoire National des Arts et Métiers Dans leur quasi totalité, les banques et organismes financiers
Plus en détailOptimisation, traitement d image et éclipse de Soleil
Kléber, PCSI1&3 014-015 I. Introduction 1/8 Optimisation, traitement d image et éclipse de Soleil Partie I Introduction Le 0 mars 015 a eu lieu en France une éclipse partielle de Soleil qu il était particulièrement
Plus en détailCalcul matriciel. Définition 1 Une matrice de format (m,n) est un tableau rectangulaire de mn éléments, rangés en m lignes et n colonnes.
1 Définitions, notations Calcul matriciel Définition 1 Une matrice de format (m,n) est un tableau rectangulaire de mn éléments, rangés en m lignes et n colonnes. On utilise aussi la notation m n pour le
Plus en détailTests non-paramétriques de non-effet et d adéquation pour des covariables fonctionnelles
Tests non-paramétriques de non-effet et d adéquation pour des covariables fonctionnelles Valentin Patilea 1 Cesar Sanchez-sellero 2 Matthieu Saumard 3 1 CREST-ENSAI et IRMAR 2 USC Espagne 3 IRMAR-INSA
Plus en détailCalcul différentiel sur R n Première partie
Calcul différentiel sur R n Première partie Université De Metz 2006-2007 1 Définitions générales On note L(R n, R m ) l espace vectoriel des applications linéaires de R n dans R m. Définition 1.1 (différentiabilité
Plus en détailaux différences est appelé équation aux différences d ordre n en forme normale.
MODÉLISATION ET SIMULATION EQUATIONS AUX DIFFÉRENCES (I/II) 1. Rappels théoriques : résolution d équations aux différences 1.1. Équations aux différences. Définition. Soit x k = x(k) X l état scalaire
Plus en détailTABLE DES MATIÈRES. PRINCIPES D EXPÉRIMENTATION Planification des expériences et analyse de leurs résultats. Pierre Dagnelie
PRINCIPES D EXPÉRIMENTATION Planification des expériences et analyse de leurs résultats Pierre Dagnelie TABLE DES MATIÈRES 2012 Presses agronomiques de Gembloux pressesagro.gembloux@ulg.ac.be www.pressesagro.be
Plus en détailApprentissage non paramétrique en régression
1 Apprentissage non paramétrique en régression Apprentissage non paramétrique en régression Résumé Différentes méthodes d estimation non paramétriques en régression sont présentées. Tout d abord les plus
Plus en détail[http://mp.cpgedupuydelome.fr] édité le 30 avril 2015 Enoncés 1
[http://mpcpgedupuydelomefr] édité le 3 avril 215 Enoncés 1 Exercice 1 [ 265 ] [correction] On note V l ensemble des matrices à coefficients entiers du type a b c d d a b c c d a b b c d a et G l ensemble
Plus en détailCours d analyse numérique SMI-S4
ours d analyse numérique SMI-S4 Introduction L objet de l analyse numérique est de concevoir et d étudier des méthodes de résolution de certains problèmes mathématiques, en général issus de problèmes réels,
Plus en détailMATHS FINANCIERES. Mireille.Bossy@sophia.inria.fr. Projet OMEGA
MATHS FINANCIERES Mireille.Bossy@sophia.inria.fr Projet OMEGA Sophia Antipolis, septembre 2004 1. Introduction : la valorisation de contrats optionnels Options d achat et de vente : Call et Put Une option
Plus en détailExo7. Matrice d une application linéaire. Corrections d Arnaud Bodin.
Exo7 Matrice d une application linéaire Corrections d Arnaud odin. Exercice Soit R muni de la base canonique = ( i, j). Soit f : R R la projection sur l axe des abscisses R i parallèlement à R( i + j).
Plus en détailAngles orientés et trigonométrie
Chapitre Angles orientés et trigonométrie Ce que dit le programme : CONTENUS CAPACITÉS ATTENDUES COMMENTAIRES Trigonométrie Cercle trigonométrique. Radian. Mesure d un angle orienté, mesure principale.
Plus en détailJournées Télécom-UPS «Le numérique pour tous» David A. Madore. david.madore@enst.fr. 29 mai 2015
et et Journées Télécom-UPS «Le numérique pour tous» David A. Madore Télécom ParisTech david.madore@enst.fr 29 mai 2015 1/31 et 2/31 : définition Un réseau de R m est un sous-groupe (additif) discret L
Plus en détailStatistiques à une variable
Statistiques à une variable Calcul des paramètres statistiques TI-82stats.fr? Déterminer les paramètres de la série statistique : Valeurs 0 2 3 5 8 Effectifs 16 12 28 32 21? Accès au mode statistique Touche
Plus en détailFonctions de plusieurs variables : dérivés partielles, diérentielle. Fonctions composées. Fonctions de classe C 1. Exemples
45 Fonctions de plusieurs variables : dérivés partielles, diérentielle. Fonctions composées. Fonctions de classe C 1. Exemples Les espaces vectoriels considérés sont réels, non réduits au vecteur nul et
Plus en détailUn K-espace vectoriel est un ensemble non vide E muni : d une loi de composition interne, c est-à-dire d une application de E E dans E : E E E
Exo7 Espaces vectoriels Vidéo partie 1. Espace vectoriel (début Vidéo partie 2. Espace vectoriel (fin Vidéo partie 3. Sous-espace vectoriel (début Vidéo partie 4. Sous-espace vectoriel (milieu Vidéo partie
Plus en détailCours 02 : Problème général de la programmation linéaire
Cours 02 : Problème général de la programmation linéaire Cours 02 : Problème général de la Programmation Linéaire. 5 . Introduction Un programme linéaire s'écrit sous la forme suivante. MinZ(ou maxw) =
Plus en détailAC AB. A B C x 1. x + 1. d où. Avec un calcul vu au lycée, on démontre que cette solution admet deux solutions dont une seule nous intéresse : x =
LE NOMBRE D OR Présentation et calcul du nombre d or Euclide avait trouvé un moyen de partager en deu un segment selon en «etrême et moyenne raison» Soit un segment [AB]. Le partage d Euclide consiste
Plus en détailLES MÉTHODES DE POINT INTÉRIEUR 1
Chapitre XIII LES MÉTHODES DE POINT INTÉRIEUR 1 XIII.1 Introduction Nous débutons par un rappel de la formulation standard d un problème d optimisation 2 linéaire et donnons un bref aperçu des différences
Plus en détailFORD C-MAX + FORD GRAND C-MAX CMAX_Main_Cover_2013_V3.indd 1-3 22/08/2012 15:12
1 2 3 4 5 6 7 8 9 10 12,999,976 km 9,136,765 km 1,276,765 km 499,892 km 245,066 km 112,907 km 36,765 km 24,159 km 7899 km 2408 km 76 km 12 14 16 1 12 7 3 1 6 2 5 4 3 11 9 10 8 18 20 21 22 23 24 26 28 30
Plus en détailDimensionnement d une roue autonome pour une implantation sur un fauteuil roulant
Dimensionnement d une roue autonome pour une implantation sur un fauteuil roulant I Présentation I.1 La roue autonome Ez-Wheel SAS est une entreprise française de technologie innovante fondée en 2009.
Plus en détailCorrigé du baccalauréat S Asie 21 juin 2010
Corrigé du baccalauréat S Asie juin 00 EXERCICE Commun à tous les candidats 4 points. Question : Le triangle GBI est : Réponse a : isocèle. Réponse b : équilatéral. Réponse c : rectangle. On a GB = + =
Plus en détailEteindre. les. lumières MATH EN JEAN 2013-2014. Mme BACHOC. Elèves de seconde, première et terminale scientifiques :
MTH EN JEN 2013-2014 Elèves de seconde, première et terminale scientifiques : Lycée Michel Montaigne : HERITEL ôme T S POLLOZE Hélène 1 S SOK Sophie 1 S Eteindre Lycée Sud Médoc : ROSIO Gauthier 2 nd PELGE
Plus en détailLa géométrie du triangle III IV - V Cercles remarquables - Lieux géométriques - Relations métriques
La géométrie du triangle III IV - V Cercles remarquables - Lieux géométriques - Relations métriques III. Cercles 1. Cercle d'euler 2. Droite d'euler 3. Théorème de Feuerbach 4. Milieux des segments joignant
Plus en détailPlus courts chemins, programmation dynamique
1 Plus courts chemins, programmation dynamique 1. Plus courts chemins à partir d un sommet 2. Plus courts chemins entre tous les sommets 3. Semi-anneau 4. Programmation dynamique 5. Applications à la bio-informatique
Plus en détailAnalyse fonctionnelle Théorie des représentations du groupe quantique compact libre O(n) Teodor Banica Résumé - On trouve, pour chaque n 2, la classe
Analyse fonctionnelle Théorie des représentations du groupe quantique compact libre O(n) Teodor Banica Résumé - On trouve, pour chaque n 2, la classe des n n groupes quantiques compacts qui ont la théorie
Plus en détailExamen optimisation Centrale Marseille (2008) et SupGalilee (2008)
Examen optimisation Centrale Marseille (28) et SupGalilee (28) Olivier Latte, Jean-Michel Innocent, Isabelle Terrasse, Emmanuel Audusse, Francois Cuvelier duree 4 h Tout resultat enonce dans le texte peut
Plus en détailCours de méthodes de scoring
UNIVERSITE DE CARTHAGE ECOLE SUPERIEURE DE STATISTIQUE ET D ANALYSE DE L INFORMATION Cours de méthodes de scoring Préparé par Hassen MATHLOUTHI Année universitaire 2013-2014 Cours de méthodes de scoring-
Plus en détailExercices du Cours de la programmation linéaire donné par le Dr. Ali DERBALA
75. Un plombier connaît la disposition de trois tuyaux sous des dalles ( voir figure ci dessous ) et il lui suffit de découvrir une partie de chacun d eux pour pouvoir y poser les robinets. Il cherche
Plus en détailCours 7 : Utilisation de modules sous python
Cours 7 : Utilisation de modules sous python 2013/2014 Utilisation d un module Importer un module Exemple : le module random Importer un module Exemple : le module random Importer un module Un module est
Plus en détailCours de Mécanique du point matériel
Cours de Mécanique du point matériel SMPC1 Module 1 : Mécanique 1 Session : Automne 2014 Prof. M. EL BAZ Cours de Mécanique du Point matériel Chapitre 1 : Complément Mathématique SMPC1 Chapitre 1: Rappels
Plus en détailFORMULAIRE DE STATISTIQUES
FORMULAIRE DE STATISTIQUES I. STATISTIQUES DESCRIPTIVES Moyenne arithmétique Remarque: population: m xμ; échantillon: Mx 1 Somme des carrés des écarts "# FR MOYENNE(série) MOYENNE(série) NL GEMIDDELDE(série)
Plus en détailL'analyse de données. Polycopié de cours ENSIETA - Réf. : 1463. Arnaud MARTIN
L'analyse de données Polycopié de cours ENSIETA - Réf : 1463 Arnaud MARTIN Septembre 2004 Table des matières 1 Introduction 1 11 Domaines d'application 2 12 Les données 2 13 Les objectifs 3 14 Les méthodes
Plus en détailCONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures)
CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE Cinquième épreuve d admissibilité STATISTIQUE (durée : cinq heures) Une composition portant sur la statistique. SUJET Cette épreuve est composée d un
Plus en détailAgrégation des portefeuilles de contrats d assurance vie
Agrégation des portefeuilles de contrats d assurance vie Est-il optimal de regrouper les contrats en fonction de l âge, du genre, et de l ancienneté des assurés? Pierre-O. Goffard Université d été de l
Plus en détailLa problématique des tests. Cours V. 7 mars 2008. Comment quantifier la performance d un test? Hypothèses simples et composites
La problématique des tests Cours V 7 mars 8 Test d hypothèses [Section 6.1] Soit un modèle statistique P θ ; θ Θ} et des hypothèses H : θ Θ H 1 : θ Θ 1 = Θ \ Θ Un test (pur) est une statistique à valeur
Plus en détailObjectifs. Clustering. Principe. Applications. Applications. Cartes de crédits. Remarques. Biologie, Génomique
Objectifs Clustering On ne sait pas ce qu on veut trouver : on laisse l algorithme nous proposer un modèle. On pense qu il existe des similarités entre les exemples. Qui se ressemble s assemble p. /55
Plus en détailLogique. Plan du chapitre
Logique Ce chapitre est assez abstrait en première lecture, mais est (avec le chapitre suivant «Ensembles») probablement le plus important de l année car il est à la base de tous les raisonnements usuels
Plus en détailCCP PSI - 2010 Mathématiques 1 : un corrigé
CCP PSI - 00 Mathématiques : un corrigé Première partie. Définition d une structure euclidienne sur R n [X]... B est clairement symétrique et linéaire par rapport à sa seconde variable. De plus B(P, P
Plus en détaildocument proposé sur le site «Sciences Physiques en BTS» : http://nicole.cortial.net BTS AVA 2015
BT V 2015 (envoyé par Frédéric COTTI - Professeur d Electrotechnique au Lycée Régional La Floride Marseille) Document 1 - Etiquette énergie Partie 1 : Voiture à faible consommation - Une étiquette pour
Plus en détailIndividus et informations supplémentaires
ADE-4 Individus et informations supplémentaires Résumé La fiche décrit l usage des individus supplémentaires dans des circonstances variées. En particulier, cette pratique est étendue aux analyses inter
Plus en détailSéquence 10. Géométrie dans l espace. Sommaire
Séquence 10 Géométrie dans l espace Sommaire 1. Prérequis 2. Calculs vectoriels dans l espace 3. Orthogonalité 4. Produit scalaire dans l espace 5. Droites et plans de l espace 6. Synthèse Dans cette séquence,
Plus en détailIntroduction à l étude des Corps Finis
Introduction à l étude des Corps Finis Robert Rolland (Résumé) 1 Introduction La structure de corps fini intervient dans divers domaines des mathématiques, en particulier dans la théorie de Galois sur
Plus en détail1S Modèles de rédaction Enoncés
Par l équipe des professeurs de 1S du lycée Parc de Vilgénis 1S Modèles de rédaction Enoncés Produit scalaire & Corrigés Exercice 1 : définition du produit scalaire Soit ABC un triangle tel que AB, AC
Plus en détail8.1 Généralités sur les fonctions de plusieurs variables réelles. f : R 2 R (x, y) 1 x 2 y 2
Chapitre 8 Fonctions de plusieurs variables 8.1 Généralités sur les fonctions de plusieurs variables réelles Définition. Une fonction réelle de n variables réelles est une application d une partie de R
Plus en détailFonctions de deux variables. Mai 2011
Fonctions de deux variables Dédou Mai 2011 D une à deux variables Les fonctions modèlisent de l information dépendant d un paramètre. On a aussi besoin de modéliser de l information dépendant de plusieurs
Plus en détailESIEA PARIS 2011-2012
ESIEA PARIS 2011-2012 Examen MAT 5201 DATA MINING Mardi 08 Novembre 2011 Première Partie : 15 minutes (7 points) Enseignant responsable : Frédéric Bertrand Remarque importante : les questions de ce questionnaire
Plus en détailAnalyse statistique de données qualitatives et quantitatives en sciences sociales : TP RÉGRESSION LOGISTIQUE (MODÈLES CHAPITRE 1)
Analyse statistique de données qualitatives et quantitatives en sciences sociales : TP RÉGRESSION LOGISTIQUE (MODÈLES CHAPITRE 1) Modèles de régression logistique à réaliser Une explicative catégorielle
Plus en détailI - PUISSANCE D UN POINT PAR RAPPORT A UN CERCLE CERCLES ORTHOGONAUX POLES ET POLAIRES
I - PUISSANCE D UN POINT PAR RAPPORT A UN CERCLE CERCLES ORTHOGONAUX POLES ET POLAIRES Théorème - Définition Soit un cercle (O,R) et un point. Une droite passant par coupe le cercle en deux points A et
Plus en détailMémo d utilisation de ADE-4
Mémo d utilisation de ADE-4 Jérôme Mathieu http://www.jerome.mathieu.freesurf.fr 2003 ADE-4 est un logiciel d analyses des communautés écologiques créé par l équipe de biostatistiques de Lyon. Il propose
Plus en détail