Estimation et calibration des paramètres



Documents pareils
Le modèle de Black et Scholes

Probabilités III Introduction à l évaluation d options

PROJET MODELE DE TAUX

TP1 Méthodes de Monte Carlo et techniques de réduction de variance, application au pricing d options

Méthodes de Simulation

MCMC et approximations en champ moyen pour les modèles de Markov


CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures)

Master Modélisation Aléatoire Paris VII, Cours Méthodes de Monte Carlo en nance et C++, TP n 2.

de calibration Master 2: Calibration de modèles: présentation et simulation d

Simulation de variables aléatoires

NON-LINEARITE ET RESEAUX NEURONAUX

Résumé des communications des Intervenants

Tests non-paramétriques de non-effet et d adéquation pour des covariables fonctionnelles

Quantification Scalaire et Prédictive

Calculating Greeks by Monte Carlo simulation

Introduction au pricing d option en finance

MATHS FINANCIERES. Projet OMEGA

I. Introduction. 1. Objectifs. 2. Les options. a. Présentation du problème.

Actuariat I ACT2121. septième séance. Arthur Charpentier. Automne charpentier.arthur@uqam.ca. http ://freakonometrics.blog.free.

Rapport de projet Risque de Crédit, Risque de Défaut : Étude de l influence du taux de recouvrement sur le prix de CDOs.

Analyse stochastique de la CRM à ordre partiel dans le cadre des essais cliniques de phase I

Génération de scénarios économiques

Modélisation des risques

Économetrie non paramétrique I. Estimation d une densité

Master IMEA 1 Calcul Stochastique et Finance Feuille de T.D. n o 1

Filtrage stochastique non linéaire par la théorie de représentation des martingales

Approximations comonotones pour le prix d une option d achat Européenne en présence de dividendes discrets

QUESTIONS D ENTRETIENS EN FINANCE DE MARCHE

3. Conditionnement P (B)

Modélisation aléatoire en fiabilité des logiciels

Contents. 1 Introduction Objectifs des systèmes bonus-malus Système bonus-malus à classes Système bonus-malus : Principes

Précision d un résultat et calculs d incertitudes

Processus aléatoires avec application en finance

La programmation linéaire : une introduction. Qu est-ce qu un programme linéaire? Terminologie. Écriture mathématique

Exercice autour de densité, fonction de répatition, espérance et variance de variables quelconques.

3 Approximation de solutions d équations

ERRATA ET AJOUTS. ( t) 2 s2 dt (4.7) Chapitre 2, p. 64, l équation se lit comme suit : Taux effectif = 1+

Chapitre 7. Statistique des échantillons gaussiens. 7.1 Projection de vecteurs gaussiens

Principe de symétrisation pour la construction d un test adaptatif

4 Distributions particulières de probabilités

Classification non supervisée

Introduction à l approche bootstrap

Modélisation et simulation

Cours de méthodes de scoring

Le modèle de régression linéaire

LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING»

Etude des propriétés empiriques du lasso par simulations

Options et Volatilité (introduction)

Evaluation des options parlatransformée de Fourier

Liste des notes techniques... xxi Liste des encadrés... xxiii Préface à l édition internationale... xxv Préface à l édition francophone...

Représentation des Nombres

Capacité d un canal Second Théorème de Shannon. Théorie de l information 1/34

Tests du χ 2. on accepte H 0 bonne décision erreur de seconde espèce on rejette H 0 erreur de première espèce bonne décision

MODELES DE DUREE DE VIE

T.P. FLUENT. Cours Mécanique des Fluides. 24 février 2006 NAZIH MARZOUQY

Soutenance de stage Laboratoire des Signaux et Systèmes

IFT3245. Simulation et modèles

Mesures de dépendance pour la séparation aveugle de sources. Application aux mélanges post non linéaires

Chapitre 1. L intérêt. 2. Concept d intérêt. 1. Mise en situation. Au terme de ce chapitre, vous serez en mesure de :

Simulation : application au système bonus-malus en responsabilité civile automobile

LEÇON N 7 : Schéma de Bernoulli et loi binomiale. Exemples.

Module 7: Chaînes de Markov à temps continu

La sophistication de la gestion des risques génère elle-même des risques

Introduction à la Statistique Inférentielle

chargement d amplitude variable à partir de mesures Application à l approche fiabiliste de la tolérance aux dommages Modélisation stochastique d un d

Moments des variables aléatoires réelles

Théorie Financière 2. Valeur actuelle Evaluation d obligations

TSTI 2D CH X : Exemples de lois à densité 1

Manuel d Utilisateur - Logiciel ModAFi. Jonathan ANJOU - Maud EYZAT - Kévin NAVARRO

Exercice : la frontière des portefeuilles optimaux sans actif certain

Premier modèle - Version simple

Baccalauréat ES Pondichéry 7 avril 2014 Corrigé

Table des matières. I Mise à niveau 11. Préface

Modèle de troncature gauche : Comparaison par simulation sur données indépendantes et dépendantes

Texte Agrégation limitée par diffusion interne

TABLE DES MATIÈRES. Bruxelles, De Boeck, 2011, 736 p.

L analyse d images regroupe plusieurs disciplines que l on classe en deux catégories :

Exercice du cours Gestion Financière à Court Terme : «Analyse d un reverse convertible»

MÉTHODE DE MONTE CARLO.

TP N 57. Déploiement et renouvellement d une constellation de satellites

INTRODUCTION INTRODUCTION

Température corporelle d un castor (une petite introduction aux séries temporelles)

Modélisation de séries financières par un modèle multifractal. Céline Azizieh

Chapitre 2 Le problème de l unicité des solutions

I3, Probabilités 2014 Travaux Dirigés F BM F BM F BM F BM F B M F B M F B M F B M

FIMA, 7 juillet 2005

MARTINGALES POUR LA FINANCE

Programmes des classes préparatoires aux Grandes Ecoles

Optimisation non linéaire Irène Charon, Olivier Hudry École nationale supérieure des télécommunications

MATHÉMATIQUES FINANCIÈRES I

Intégration et probabilités TD1 Espaces mesurés Corrigé

Théorie de l estimation et de la décision statistique

OPTIMISATION À UNE VARIABLE

Chapitre 7 : Intégration sur un intervalle quelconque

Modèle GARCH Application à la prévision de la volatilité

TRAVAIL D ETUDE ET DE RECHERCHE. Utilisation des arbres binomiaux pour le pricing des options américaines

Ecole Polytechnique Macroéconomie avancée-eco 553 Chapitre 2 : Epargne, accumulation du capital et croissance

(51) Int Cl.: H04L 29/06 ( ) G06F 21/55 ( )

Options exotiques. April 18, 2000

Transcription:

et calibration des paramètres 6-601-09 Simulation Monte Carlo Geneviève Gauthier HEC Montréal 1

1. Nous allons discuter des diverses façons de déterminer les paramètres des modèles que nous employons lors de la simulation de Monte Carlo. 2. Plus précisément, nous aborderons 2.1 les estimateurs du maximum de pour certains processus de di usion couramment utilisés, 2.2 et la calibration des modèles à l aide des prix des produits dérivés. 2

Mise en garde I Il existe plusieurs méthodes permettant la construction d estimateurs et ces méthodes peuvent mener à des estimateurs di érents. Ils ont chacun leurs forces et leurs faiblesses : I I I I I sans biais ou asymptotiquement sans biais, petite ou grande variance, distribution connue ou inconnue, nécessite ou non une méthode numérique a n de les évaluer, etc. 3

à l estimation par la méthode du maximum de I simple 1. Estimons θ =probabilité que le rendement d un titre excède le rendement sans risque au cours d une journée. 2. Contruisons X i = 1 si le rendement du titre dépasse le rendement sans risque le jour i et 0 sinon. 3. Supposons que les rendements quotidiens sont indépendants entre eux et que la probabilité de dépassement est la même à chaque jour : θ = P (X i = 1). 4. Remarquons que θ doit être compris entre 0 et 1 puisqu il représente une probabilité. 4

à l estimation par la méthode du maximum de II simple 5. Observons la variable indicatrice x 1,..., x 10 au cours des 10 derniers jours. 5.1 Supposons que nous avons observé 1, 1, 0, 0, 1, 1, 1, 0, 1, 1 5

à l estimation par la méthode du maximum de III simple 6. La fonction de f (1, 1, 0, 0, 1, 1, 1, 0, 1, 1; θ) est, dans ce cas, la probabilité d avoir observé un tel échantillon en supposant que la probabilité de dépassement au cours d une journée est θ : f (1, 1, 0, 0, 1, 1, 1, 0, 1, 1; θ) = P (X 1 = 1, X 2 = 1, X 3 = 0,..., X 10 = 1) = P (X 1 = 1) P (X 2 = 1)...P (X 10 = 1) car les X i sont indépendants = θθ (1 θ) (1 θ) θθθ (1 θ) θθ = θ 7 (1 θ) 3. 6

à l estimation par la méthode du maximum de IV simple 7. Nous allons choisir comme estimation de maximum de de θ la valeur bθ qui maximise la fonction de. Fonction de θ 7 (1 θ) 3 y 0.002 0.001 0.000 0.0 0.2 0.4 0.6 0.8 1.0 Le maximum est atteint lorsque θ = 7 10. Notre estimation du maximum de est donc bθ = 7 x 10. 7

à l estimation par la méthode du maximum de I Idées maîtresses 1. Dans le cas où les variables sont de loi discrète, la fonction de f (x 1,..., x n ; θ) est la fonction de masse conjointe de notre échantillon. 1.1 Elle peut être interprétée comme la probabilité d avoir obtenu l échantillon que l on a en main en supposant que la valeur du paramètre est θ. 2. Dans le cas où les variables sont de loi continue, la fonction de f (x 1,..., x n ; θ) est la fonction de densité conjointe de notre échantillon. 8

à l estimation par la méthode du maximum de II Idées maîtresses 3. Comme le logarithme est une fonction croissante, trouver la valeur de θ qui maximise la fonction de f (x 1,..., x n ; θ) est équivalent à déterminer la valeur de θ qui maximise le logarithme de la fonction de ln f (x 1,..., x n ; θ) (nous obtiendrons la même estimation). 3.1 Cette remarque est importante puisque dans de nombreux cas pratiques, il est plus facile d optimiser ln f (x 1,..., x n ; θ). 9

Pourquoi une estimation par la méthode du maximum de? I Dans plusieurs cas, cette méthode a les avantages suivants : 1. L estimateur bθ résout le système ln f θ x 1,..., x n ; bθ = 0; Sinon, ln f (x 1,..., x n ; θ) peut être optimisée numériquement. 2. L écart-type de nos estimations peut être estimé lorsque la longueur n de la série chronologique est grande. En e et, la matrice de variances-covariances de bθ est approchée par 0 1 bσ = @ 1 A 2 ln f θ i θ j x 1,..., x n ; bθ 10

Pourquoi une estimation par la méthode du maximum de? II 3. Il est possible de calculer des intervalles de con ance et d exécuter des tests d hypothèse puisque la loi de bθ θ est approximativement de loi normale d espérance 0 et de variances bσ lorsque n est grand. 4. Si la quantité que l on souhaite estimer est une transformation des paramètres, α = g (θ), alors bα = g b θ et l estimateur de la variance de l estimateur bα de α est \Var (bα) = g bθ 0 \ Var b θ. 11

Dé nition 1. Le mouvement brownien à coe cient constant est caractérisé par l équation di érentielle stochastique dx t = µ dt + σ dw t. 2. Il peut aussi être décrit à partir de la solution de l équation ci-dessus : si Z 1, Z 2,... est une suite de variables aléatoires indépendantes et identiquement distribuées de loi N (0, 1) alors X (i+1)h = X ih + µh + σ p hz i et est de loi normale d espérance µh et de variance σ 2 h. 12

I La fonction du log- 1. Supposons que nous observons une série chronologique (de rendements) x 0, x 1,..., x n à intervalles réguliers de longueur h. 2. Dans le cas des processus markoviens (le MBA en est un), la fonction de densité conjointe de l échantillon est f X0,...,X n (x 0,..., x n ) = n i=1 f Xi jx i 1 (x i jx i 1 ). 13

II La fonction du log- 3. La fonction de log- est L µ, σ 2 = ln f X0,...,X n µ, σ 2 ; x 0,..., x n = = = n ln f Xi jx i 1 (x i jx i 1 ) i=1 n ln i=1 1 p 2πσ 2 h exp 1 2 n 2 ln 2πσ2 h n 1 i=1 2!! (x i x i 1 µh) 2 σ 2 h (x i x i 1 µh) 2 σ 2. h puisque X ih = X (i 1)h + µh + σ p hz i 1 implique que f Xi jx i 1 (x i jx i 1 ) est gaussienne. 14

Estimateur ponctuel Résultat. Les estimateurs du maximum de pour µ et σ sont respectivement bµ = 1 nh s bσ = n (x i x i 1 ) = x n x 0 i=1 nh 1 nh La preuve est donnée en annexe. n (x i x i 1 ) 2 bµ 2 h. i=1 15

Exemple bµ = x n x 0 nh = 0, 619905093 q 1 bσ = nh n i=1 (x i x i 1 ) 2 bµ 2 h = 0, 099658184. 16

I Mesure de la précision de nos estimations 1. Une des façons de véri er si les estimations obtenues ont la précision désirée est d estimer l écart-type de l estimateur. 1.1 Plus l écart-type est grand, plus il est probable d obtenir une estimation qui est éloignée de la vraie valeur du paramètre. 17

II Mesure de la précision de nos estimations Résultat. Dans de nombreux cas dont celui de l estimation des paramètres d un MBA, la distribution asymptotique des estimateurs est gaussienne, c est-à-dire que bµ est approximativement de loi N µ; σ2 nh bσ est approximativement de loi N σ; 1 σ 2 2 n pourvu que le nombre n de données contenues dans la série chronologique servant à l estimation soit assez grand. Il y a une justi cation de certains résultats en annexe. 18

Mesure de la précision de nos estimations Rappel : bµ N µ; σ2 nh et bσ N σ; 1 2 σ 2 n 1. la variance de bµ diminue non pas avec le nombre n d observations mais plutôt avec la longueur nh de la période d observation. 2. la variance de bσ diminue avec le nombre n d observations, peu importe la longueur de la période d estimation. 3. plus la volatilité σ sera faible, plus précises seront nos estimations bµ et bσ. 19

Exemple Avec les données précédentes, nous estimons l écart-type de bµ par s s bσ 2 0, 099658184 2 q Var \(bµ) = nh = 500 1 250 = 0, 070468978 et celui de bσ par s q 1 bσ \Var 2 r 1 (bσ) = 2 n = 0, 099658184 2 = 0, 003151468. 2 500 20

I par intervalle de con ance 1. La connaissance de la distribution (asymptotique) des estimateurs permet d estimer les paramètres µ et σ par des intervalles de con ance. 2. Le niveau de con ance 1 1 α d un intervalle peut s interpréter de la façon suivante : il y a une proportion de 1 α des échantillons (dans notre cas, ce sont les séries chronologiques observées) qui produiront un intervalle de con ance qui contient le paramètre que l on souhaite estimer et il y a une proportion de α des échantillons qui nous mèneront à construire un mauvais intervalle de con ance dans le sens où ce dernier ne contiendra pas le paramètre que l on tente d estimer. 21

II par intervalle de con ance 3. En pratique, α est souvent choisi égal à 5 %. 4. Malheureusement, nous n avons qu un seul échantillon et il ne nous sera pas possible de déterminer s il appartient à l ensemble des bons intervalles ou aux mauvais intervalles de con ance. 5. L intervalle de con ance de niveau de con ance 1 α pour µ est q q bµ z Var \(bµ); bµ + z α \ α2 2 Var (bµ) où z β est le quantile d ordre 1 normale centrée et réduite. β de la distribution 22

III par intervalle de con ance 6. L intervalle de con ance de niveau de con ance 1 α pour σ est bσ z α2 q \ Var (bσ); bσ + z α2 q \Var (bσ) 1 0 < α < 1. 23

Exemple L intervalle de con ance de niveau de con ance 95 % pour µ est q q bµ z 2,5 % Var \(bµ); bµ + z 2,5 % Var \(bµ) = [0, 6199 1, 96 0, 0705; 0, 6199 + 1, 96 0, 0705] = [0, 4818; 0, 7580]. L intervalle de con ance de niveau de con ance 95 % pour σ 2 est q q bσ z \ α2 Var (bσ); bσ + z α2 \Var (bσ) = [0, 0997 1, 96 0, 0032; 0, 0997 + 1, 96 0, 0032] = [0, 0935; 0, 1058]. 24

géométrique Le MBG est caractérisé par l EDS Puisque ds t = µs t dt + σs t dw t. (1) d ln S t = µ σ 2 dt + σ dw t, (2) 2 il est possible d estimer les paramètres du MBG à partir du logarithme de nos observations et des estimateurs du MBA. 25

Une version en temps discret 1. Nous considérons une version en temps discret d un processus de retour. r (i+1)h = r ih + κ (θ r ih ) h + σ p hz i où Z 1, Z 2,... forment une suite de variables aléatoires indépendantes de distribution normale centrée et réduite. 2. Ainsi r (i+1)h est de loi normale d espérance conditionnelle r ih + κ (θ r ih ) h et d écart-type conditionnel σ p h. 2.1 La fonction de que nous obtiendrons est celle de l approximation d Euler stochastique du processus d Ornstein-Uhlenbeck. 2.2 Il est possible d utiliser la solution exacte a n d estimer les paramètres d un processus OU. 2.3 La fonction de résultante est un peu plus lourde à maximiser analytiquement. 26

Exemple d une trajectoire 27

Estimateurs ponctuels Les estimateurs du maximum de pour les paramètres θ, κ et σ 2 du modèle sont respectivement où bθ = S r V r C r D r nv r S r D r bκ = 1 h nbθ D r S r bσ 2 = 1 n 2 nh r ih r (i 1)h bκ b θ r (i 1)h h i=1 S r = n i=1 r (i 1)h D r = n i=1 r ih r (i 1)h C r = n i=1 r 2 (i 1)h V r = n i=1 r (i 1)h r ih r (i 1)h 28

Exemple Les estimateurs du maximum de pour les paramètres θ, κ et σ du modèle sont respectivement bθ = S r V r C r D r nv r S r D r 34.54680977 ( 0.008244855) 2.503121219 ( 0.005657487) = 500 ( 0.008244855) 34.54680977 ( 0.005657487) = 0, 068926275 bκ = 1 h nbθ D r S r = 1 ( 0.005657487) 1 12 500 0.068926275 34.54680977 = 0, 811379683 bσ = s n 1 2 nh r ih r (i 1)h bκ b θ r (i 1)h h i=1 = 0, 01909883. 29

I La précision 1. Les variances de nos estimateurs bθ, bκ et bσ sont estimées par \ Var b θ = bσ2 nhbκ 2, \Var (bκ) = 1 nh \Var (bσ) = 1 1 n 2 1 n n i=1 2 1 n n i=1 bσ 2 2, b θ r (i 1)h bσ 2 r ih r (i 1)h bκ( b θ r (i 1)h )h bσ p h 2 1. 30

II La précision 2. bθ N θ; nh 1 bκ N κ; nh 1 0, σ2 κ 2 et bσ N B @ σ; n 1 1 2 σ 2 1 n n i=1(θ r (i 1)h) 2 2 1 n n i=1 σ 2! 2 r ih r (i 1)h κ(θ r (i 1)h )h bσ p 1 h 1 C A 2.1 La précision des estimations de θ et κ dépendent de la longueur nh de la période d échantillonnage plutôt que du nombre d observations. 2.2 La précision des estimations de σ dépend du nombre n d observations. 2.3 Plus σ sera petit, meilleure sera la précision de nos estimés. 31

Exemple Les estimations des écarts-types de nos estimateurs du maximum de pour les paramètres θ, κ et σ 2 sont bθ = 0, 0689 \ Var b θ 1 2 = 0, 0036, bκ = 0, 8114 bσ = 0, 0191 \Var (bκ) 1 2 = 0, 1941, \Var (bσ) 1 2 = 0, 0006. 32

I Estimateurs des 1. En isolant les Z i dans le processus original, il vient Z i = r (i+1)h r ih κ (θ r ih ) h. σh 2 1 2. La somme des erreurs au carré est une fonction des paramètres du modèle Q (κ, θ) = n Zi 2 = i=1 n i=1 r(i+1)h r ih κ (θ r ih ) h 2. σh 1 2 3. Dans le cas de ce processus de retour, les estimateurs des sont les mêmes que les estimateurs obtenus par la méthode du maximum de. 33

I Caractéristiques des estimateurs 1. En théorie, 1.1 Plus le nombre n d observations 2 contenues dans la série chronologique et plus la longueur nh de la période d estimation sont grands, meilleures seront nos estimations. 1.2 Plus la volatilité σ est petite, meilleures seront nos estimations. 1.3 Les estimateurs sont asymptotiquement gaussiens, ce qui permet la construction d intervalle de con ance et de tests d hypothèses lorsque n est grand. 2. En pratique, 2.1 Il faut de très longues séries chronologiques pour bien capturer l e et du retour. 2.2 Dans les applications classiques en nance, on remarque que l estimation du κ est généralement moins précise. 2 n + 1 si on compte l observation numéro 0. 34

Exemple Là où l art de la statistique compte autant que la théorie! 35

Exemple Les données Consider the LME from May 15, 2001, to May 15, 2006. LME Price 3 500.00 $ 3 000.00 $ 2 500.00 $ 2 000.00 $ 1 500.00 $ 1 000.00 $ Evolution of the LME price 500.00 $ $ 5/15/2001 7/24/2001 10/2/2001 12/10/2001 2/22/2002 5/7/2002 7/17/2002 9/25/2002 12/3/2002 2/14/2003 4/28/2003 7/8/2003 9/16/2003 11/24/2003 2/4/2004 4/15/2004 6/25/2004 9/3/2004 11/11/2004 1/24/2005 4/5/2005 6/15/2005 8/23/2005 11/1/2005 1/12/2006 3/22/2006 36

Exemple Statistiques descriptives Descriptive Statistics Variable N Mean Median StDev SE Mean LMEPrice 1261 1640.0 1520.5 339.4 9.6 Variable Minimum Maximum Q1 Q3 LMEPrice 1242.5 3186.8 1377.1 1818.5 37

Exemple Distribution échantillonnale 200 Frequency 100 0 1000 2000 LMEPrice 3000 38

Exemple La modélisation 1. Nous voulons modéliser le prix dans un an (T = 1). 2. Nous allons estimer trois modèles sur cet échantillon de prix : 2.1 Modèle statique. Le prix S 1 est supposé être distribué selon une loi log-normale 2.2 géométrique. La dynamique du prix est modélisé par un MBG. ds t = µs t dt + σs t dw t 2.3 Ornstein-Uhlenbeck. La dynamique du logarithme du prix (rendement) est modélisé par un processus OU. d ln S t = κ (µ ln S t ) dt + σdw t 39

Exemple Le modèle statique I Supposons que la distribution de S T est de loi lognormale : I S T = S 0 exp (α T + β T Z ) où Z est de loi N (0, 1). I E [S T ] = S 0 exp α T + β2 T2 et I Var [S T ] = S0 2 exp 2α T + β 2 T exp β 2 T 1. I Partant des équations précédentes, il vient I β 2 T = ln Var[S T ]+(E[S T ]) 2 (E[S T ]) 2 I α T = ln E[S T ] S 0 1 2 ln Var[S T ]+(E[S T ]) 2 (E[S T ]) 2. I Question. Comment estime-t-on les α T et β T? I Une pratique est d utiliser la moyenne et la variance de l échantillon de la dernière année. I et Nous verrons pourquoi cela n est pas toujours la bonne chose à faire 40

Exemple Le modèle statique LME Price 3 500.00 $ 3 000.00 $ 2 500.00 $ 2 000.00 $ 1 500.00 $ 1 000.00 $ 500.00 $ $ 5/16/2005 5/26/2005 6/8/2005 6/20/2005 6/30/2005 7/12/2005 7/22/2005 8/3/2005 Evolution of the LME price 8/15/2005 8/25/2005 9/7/2005 9/19/2005 9/29/2005 10/11/2005 10/21/2005 11/2/2005 11/14/2005 11/24/2005 12/6/2005 12/16/2005 12/30/2005 1/12/2006 1/24/2006 2/3/2006 2/15/2006 2/27/2006 3/9/2006 3/21/2006 3/31/2006 4/12/2006 4/26/2006 5/9/2006 Sample mean (May 17, 2005, to May 15, 2006) : 2 131.49 $ Sample st. dev. (May 17, 2005, to May 15, 2006) : 345.01 $ Sample variance (May 17, 2005, to May 15, 2006) : 119 032.4653 41

Exemple Le modèle statique β 2 1 = ln Var [S 1] + (E [S 1 ]) 2 β 1 (E [S 1 ]) 2? 119032.4653 + (2131.49)2 = ln (2131.49) 2 = 0.0259 s? = 119032.4653 + (2131.49)2 ln (2131.49) 2 = 0.1608 α 1 = ln E [S 1] S 0 1 2 ln Var [S 1] + (E [S 1 ]) 2 (E [S 1 ]) 2? = ln 2131.49 1722.25 1 119032.4653 + (2131.49)2 ln 2 (2131.49) 2 = 0.2003 42

Exemple Les modèles dynamiques I Les modèles dynamique ont été estimés avec la méthode du maximum de. I Notons que pour tous les modèles choisis, le prix au temps T sera de loi log-normale. Ce sont les espérances et la variances qui varient. I Lorsque la dynamique choisie est d ln S t = κ (µ ln S t ) dt + σdw t, le prix au temps T satisfait l équation s (ln S 0 µ) e κt 1 e 1 +σ 2κT Z {z } 2κ {z } α T S T = β S 0 e T 43

Exemple Static Dynamic Sample: 1 year Dynamic Sample: 4 years Dynamic Mean-reverting S 1 = S 0 e α 1+β 1 Z S 1 = S 0 e S 1 = S 0 e µ σ2 2 +σz bµ µ σ2 2 +σz bµ bα 1 = 0.2003 bβ 1 = 0.1608 bσ 2 2 = 0.5330 bσ = 0.2425 bσ 2 2 = 0.1882 bσ = 0.1969 S 1 = S 0 e α 1 +β 1 Z α 1 = 0.0216 β 1 = 0.1325 44

Exemple LME Price 6 000.00 $ 5 000.00 $ 4 000.00 $ 3 000.00 $ 2 000.00 $ 1 000.00 $ $ Evolution of the LME price 6/5/2002 7/31/2002 9/26/2002 11/21/2002 1/22/2003 3/19/2003 5/19/2003 7/15/2003 9/10/2003 11/5/2003 1/5/2004 3/1/2004 4/28/2004 6/25/2004 8/20/2004 10/18/2004 12/13/2004 2/10/2005 4/11/2005 6/8/2005 8/3/2005 9/29/2005 11/24/2005 1/24/2006 3/21/2006 Px Last Expectation Static model Expectation Dynamic model 1 year sample Expectation Dynamic model 4 years sample Expectation Static model Expectation Mean reverting 5 years sample 0.014 0.012 0.01 0.008 0.006 0.004 0.002 0 1 500 $ 2 000 $ 2 500 $ 3 000 $ 3 500 $ 4 000 $ 4 500 $ 5 000 $ 5 500 $ 6 000 $ 6 500 $ 7 000 $ 7 500 $ 8 000 $ 8 500 $ 9 000 $ 9 500 $ 10 000 $ Static Dynamic (1 year) Dynamic (4 years) Mean Reverting 45

Exemple Conclusion I Même en ayant choisi une bonne distribution, le choix des paramètres produit des prévisions très di érentes les unes des autres. I I I Le choix de la dynamique du modèle est important. Le choix de la période d échantillonnage est important. Le choix des variables à modéliser (prix?, log prix?) est important. I Quel est le meilleur modèle? I I Cela dépend des données L art du statisticien est justement la construction des modèles et leur estimation. Attention aux apprentis sorciers! 46

1. Les données nancières di èrent des données usuelles en statistique du fait qu il est possible d observer d autres données en rapport avec le modèle choisi. 2. Par exemple, nous n observons pas seulement les rendements des actions d une compagnie mais nous avons aussi des prix pour ses options. 3. Il est possible d utiliser ces prix a n 3.1 d estimer certains des paramètres du modèle et 3.2 de véri er si le modèle est adéquat. 47

I 1. Dans le contexte de Black et Scholes, le titre sous-jacent est modélisé par un MBG : ds t = µs t dt + σs t dw P t. 2. Avec le passage en monde neutre au risque, où r est le taux sans risque. ds t = rs t dt + σs t dw Q t 3. Le prix au temps t = 0 d une option d achat d échéance T et de prix d exercice K est P0 modèle (T, K; σ, r) = S 0 N (d) Ke rt N d σ p T ln S 0 ln K + T et N () est où d = 1 σ p r + σ2 T 2 la fonction de répartition d une N (0, 1). 48

II 4. On pourrait estimer σ et r en minimisant la distance entre les prix donnés par le modèle et les prix observés D (σ, r) = i 0 (T i, K i ; σ, r) P0 observés (T i, K i ) P modèle 49

III 5. Il y a plusieurs façons de déterminer la distance entre les prix observés et théoriques. 5.1 L erreur absolue : P0 modèle (T i, K i ; σ, r) P0 observés (T i, K i ), 5.2 L erreur relative : P0 modèle (T i, K i ; σ, r) P0 observés (T i, K i ) P0 observés, (T i, K i ) 5.3 L erreur au carré : 2 P0 modèle (T i, K i ; σ, r) P0 observés (T i, K i ). 5.4 etc. 50

IV 6. La volatilité implicite associée au modèle de Black et Scholes est un exemple de calibrage. Il faut chercher le σ K,T qui fait en sorte que le prix donné par le modèle et le prix observé concordent P modèle 0 (T, K; σ K,T, r) = P observé 0 (T, K ) et est obtenu en résolvant l équation P observé 0 (T, K ) = S 0 N d r,σk,t Ke rt N où d r,σk,t = ln S 0 ln K + r + σ2 K,T 2 T p. σ K,T T d r,σk,t σ K,T p T. 51

V 7. Le prix d une option d achat à la monnaie et venant à échéance dans 3 mois est de 4.58 $. Sachant que S 0 = 100, r = 5% Z 4.58 = 100 ln 100 ln 100+ 0.05+ σ2 1 2 4 σp 14 100e 0.05 1 4 Solution: σ = 0.198 22. Z e z2 2 p 2π dz ln 100 ln 100+ 0.05+ σ2 2 σ 1 4 p 14 σ p 1 4 e z2 2 p 2π dz. 52

VI 8. Le prix d une option d achat à la monnaie et venant à échéance dans 6 mois est de 5.53 $. Sachant que S 0 = 100, r = 5% Z 5.53 = 100 ln 100 ln 100+ 0.05+ σ2 1 2 2 σp 12 100e 0.05 1 2 Solution: 0.150 11. Z e z2 2 p 2π dz ln 100 ln 100+ 0.05+ σ2 2 σ 1 2 p 12 σ p 1 2 e z2 2 p 2π dz. 53

VII 9. Si nous avons plusieurs prix d options, P0 modèle 1, 100; σ, 5% 2 y 15 10 2 5.53 + P0 modèle 1, 100; σ, 5% 4 2 4.58 5 0 0.06 0.08 0.10 0.12 0.14 0.16 0.18 0.20 0.22 0.24 x 54

I Avantages et inconvénients 1. Nous ne connaissons pas la distribution des estimés obtenus par la calibration. Il n est donc pas possible de faire de l inférence. 2. En utilisant les prix des produits dérivés, nous pouvons estimer les paramètres du modèle en monde neutre au risque mais il ne nous est pas possible d estimer les paramètres qui sont seulement liés au modèle en probabilité objective. 3. En utilisant une série historique et une méthode d estimation, nous allons chercher de l information concernant le comportement passé de la variable. Par contre, l information contenue dans les prix des produits dérivés re ètent les anticipations qu ont les intervenants du comportement futur du titre sous-jacent. 55

II Avantages et inconvénients 4. La fonction distance D () permet de mesurer (en partie) l adéquation du modèle. 5. Dans l exemple précédent, nous avons une solution analytique pour les prix des produits dérivés donnés par le modèle. 5.1 Ceci n est pas une condition nécessaire à l utilisation du calibrage. 5.2 Nous pouvons obtenir ces prix par la simulation de Monte Carlo et optimiser la fonction de distance D () numériquement. 56

Les I Le contexte 1. En pratique, nous sommes souvent en présence de modèles multivariés (plusieurs variables comme des prix, des taux de change, des taux d intérêt, etc.). 2. Selon les modèles retenus, il est possible de déterminer la fonction de associée à la version multivariée du modèle. 3. Les di cultés rencontrées sont les suivantes : 3.1 Les séries chronologiques constituant notre échantillon n ont pas toute la même longueur ou la même fréquence. 3.2 Il y a de nombreux paramètres et l optimisation numérique devient complexe. 57

Les II Le contexte 3.2.1 Une solution envisageable est une optimisation en plusieurs temps : (1) estimation des paramètres de chaque processus de façon univariée (à l aide de la fonction de univariée) et (2) estimation des à l aide de la fonction de multivariée en supposant les autres paramètres connus. 3.2.2 Cette façon de procéder ne maximise vraisemblablement pas la fonction de multivariée mais il est fort possible que la solution obtenue soit proche de l optimum. 3.2.3 Il faut alors faire une étude par simulation a n de véri er si l algorithme proposé donne de bons estimés des paramètres. 3.2.4 Les estimations des écarts-types des estimateurs seront faussées (basées sur les dérivées secondes de la fonction de ) car toute l incertitude n est pas prise en compte dans chacune des deux étapes. 58

Les III Le contexte 3.3 La fonction de globale est possiblement non-convexe, impliquant que des algorithmes d optimisation basés sur les gradients peuvent restés captifs d un optimum local. Il faut donc envisager des méthodes d optimisation plus sophistiquées. 59

des I sur les prix ou sur les rendements? 1. Une question souvent posée en pratique est de savoir si l on doit estimer les entre deux actifs à partir des séries chronologiques des prix ou des rendements. 1.1 Si le but visé est simplement une analyse descriptive des événements passés, l utilisation des moyennes, des écarts-types et des échantillonnaux décrivent de façon raisonnable les niveaux, les dispersions ainsi que les entre les variables. 1.2 Par contre, si le but visé est de prévoir le comportement futur des variables, il vaut mieux travailler avec des séries stationnaires ou, sinon, utiliser des modèles dynamiques qui prennent en compte l autocorrélation des séries de données. 60

des II sur les prix ou sur les rendements? 2. simple. 2.1 Supposons que nous observions une trajectoire W tt,..., W tn d un mouvement brownien où t k = kh. 2.2 Qu est-ce que la variance échantillonnale S 2 = n 1 n i =1 W t 2 i W 2 où W = n 1 n i =1 W t i permet d estimer? 2.2.1 La réponse est rien de ce qui peut ressembler à la variance d un mouvement brownien puisque cette dernière varie au cours du temps. 2.2.2 La variance échantillonnale permet d estimer Var [X ] lorsque l échantillon est constitué de variables indépendantes et identiquement distribuées à X. 61

des III sur les prix ou sur les rendements? 2.2.3 Dans notre exemple, il n y a ni indépendance, ni conservation de la distribution : E hw 2i = 1 n n n 2 E W ti W tj i=1 j=1 = 1 n h i n 2 E Wt 2 i + 2 n n n i=1 2 E W ti W tj i=1 j=i+1 = 1 n n 2 t i + 2 n n n i=1 2 t i i=1 j=i+1 = h n n 2 i + 2h n i=1 2 = h 2 n + 1 n 2.2.4 E S 2 = 1 n n i=1 E W 2 t i n i=1 n j=i+1 + h (n 1) (n + 1) 3 n E i h W 2i = 5 6 h (n 1)(n+1) n 62

des IV sur les prix ou sur les rendements? 3. Il en va de même pour la covariance. Comme la corrélation échantillonnale est fonction de la covariance échantillonnale et des écarts-type échantillonnaux, cette dernière a un pouvoir prévisionnel que si l échantillon est constitué de vecteurs aléatoires iid. 4. Or, dans plusieurs modèles couramment utilisés, le processus de rendement est formé de v.a. iid. 4.1 Cela permet d utiliser les séries de rendements pour estimer une corrélation (supposée constante au cours du temps) entre les rendements de deux titres. 4.2 Il faut alors simuler les rendements avec la corrélation estimée et transformer les rendements simulés en prix. 63

des V sur les prix ou sur les rendements? 5. Il en va de même pour la covariance. Comme la corrélation échantillonnale est fonction de la covariance échantillonnale et des écarts-types échantillonnaux, cette dernière a un sens que si l échantillon est constitué de v.a. iid. 6. Or, dans plusieurs modèles couramment utilisés, le processus de rendement est formé de v.a. iid. 6.1 Cela permet d utiliser les séries de rendements pour estimer une corrélation (supposée constante au cours du temps) entre les rendements de deux titres. 6.2 Il faut alors simuler les rendements avec la corrélation estimée et transformer les rendements simulés en prix. 64

NGARCH Le processus Rappelons que ln S t = ln S t 1 + r + λ p h t 1 2 h t + p h t Z t h t+1 = β 0 + β 1 h t + β 2 h t (Z t θ) 2. 65

NGARCH En isolant Z t dans l équation nous trouvons ln S t = ln S t 1 + r + λ p h t 1 2 h t + p h t Z t, Z t = ln S t S t 1 r λ p h t + 1 2 h t p ht, et h t+1 = β 0 + β 1 h t + β 2 h t ln S t S t 1 r λ p h t + 1 2 h t p ht = β 0 + β 1 h t + β 2 ln = fonction (ln S t, ln S t 1, h t ). S t S t 1 r λ p h t + 1 2 h t θ p h t θ! 2 2 66

NGARCH Fonction de densité conditionnelle Puisque ln S t = ln S t 1 + r + λ p h t 1 2 h t + p h t Z t, alors = f ln St jln S t 1,h t (s t, s t 1 ) 0 1 B p exp @ 1 ln s t s t 1 r λ p 2 1 h t + 1 2 h t C A 2πht 2 h t et h t+1 = β 0 + β 1 h t + β 2 ln s t s t 1 r λ p h t + 1 2 h t θ p h t 2 67

NGARCH La fonction de Utilisant le fait que f(s t, h t+1 ) : t 2 Ng est markovien, = = f ln S0,...,ln S t n f ln Si jln S i 1,h i (s i, s i 1 ) i=1 0 n i=1 1 B p exp @ 1 2πhi 2 ln s i s i 1 r λ p h i + 1 2 h i h i 2 1 C A où h i+1 = β 0 + β 1 h i + β 2 ln s i s i 1 r λ p h i + 1 2 h i θ p h i 2. 68

I Estimateur ponctuel Résultat. Les estimateurs du maximum de pour µ et σ sont respectivement bµ = 1 nh s bσ = Preuve. Puisque ln f µ ln f σ 2 n (x i x i 1 ) = x n x 0 i=1 nh 1 nh x 0,..., x n ; µ, σ 2 = n (x i x i 1 ) 2 bµ 2 h. i=1 = x 0,..., x n ; µ, σ 2 = n x i x i 1 µh σ i=1 2 n x i x i 1 σ i=1 2 n µh σ 2 n n 2σ 2 + 1 2 i=1 (x i x i 1 µh) 2 (σ 2 ) 2. h 69

II Estimateur ponctuel alors si et seulement si ln f X1,...,X n µ ln f X1,...,X n σ 2 x 0,..., x n ; bµ, bσ 2 = 0 x 0,..., x n ; bµ, bσ 2 = 0 bµ = 1 n nh (x i x i 1 ) i=1 bσ 2 = 1 nh n i=1 (x i x i 1 bµh) 2 = 1 n nh (x i x i 1 ) 2 bµ 2 h i=1 70

I Mesure de la précision de nos estimations Résultat. bµ est approximativement de loi N µ; σ2 nh bσ est approximativement de loi N σ; 1 σ 2 2 n pourvu que le nombre n de données contenues dans la série chronologique servant à l estimation soit assez grand. Preuve. 1. Sous certaines hypothèses de régularité, l estimateur du maximum de est asymptotiquement gaussien. 2. La matrice de variances-covariances des! estimateurs est elle-même 1 estimée par bσ = 2. θ i θ ln f (x 1,...,x n ;θ) j θ= bθ 3. Nous devons donc calculer les dérivées secondes : 71

II Mesure de la précision de nos estimations 3.1 2 ln f x µ 2 0,..., x n ; µ, σ 2 = nh σ 2 3.2 2 ln f x ( σ 2 ) 2 0,..., x n ; µ, σ 2 = n 2(σ 2 ) 2 n (x i x i 1 µh) 2 i =1 = (σ 2 ) 3 h n + n 2(σ 2 ) 2 σ2 bσ 2 nh (µ bµ) 2 (σ 2 ) 3 (σ 2 ) 3 72

III Mesure de la précision de nos estimations 4. Ainsi, les estimateurs des variances de nos estimateurs sont 4.1 \ Var (bµ) = 1 2 ln f 4.2 µ 2 (x 0,...,x n ;µ,σ 2 ) µ=bµ σ 2 =bσ 2 \ Var bσ 2 = 1 2 ln f ( σ 2 ) 2 (x 0,...,x n ;µ,σ 2 ) µ=bµ σ 2 =bσ 2 = bσ2 nh = 2bσ2 n. 5. Puisque α = g (θ) implique que l estimation de la variance de l estimateur bα de α est Var \ (bα) = g 0 \ bθ Var b θ, la variance de bσ est estimée par ( σ 2 p σ2 ) 2 2 ln f X1,...,Xn ( σ 2 ) 2 (x 0,...,x n ;µ,σ 2 ) µ=bµ σ 2 =bσ 2 = p 2 1 2 bσ 2 n 2(bσ 2 ) 2 = 1 2 bσ 2 n. 73

I Preuve La fonction de densité conjointe ainsi que son logarithme sont respectivement f r 0,..., r nh ; κ, θ, σ 2 = = n r(i f r ih 1)h i=1 0 n i=1 1 (2πσ 2 h) 1 2 B exp @ 1 2 r ih r (i 1)h κ θ r (i 1)h h σ 2 h 2 1 C A = ln f r 0,..., r nh ; κ, θ, σ 2 n 2 ln 2πσ h 2 n 1 2 i=1 2 r ih r (i 1)h κ θ r (i 1)h h σ 2 h 74

II Preuve Les dérivées partielles sont = = = ln f θ n κ i=1 r 0,..., r nh ; κ, θ, σ 2 r ih r (i 1)h κ θ r (i 1)h h σ 2 ln f r 0,..., r κ nh ; κ, θ, σ 2 θ r (i 1)h r ih r (i 1)h κ n i=1 ln f σ 2 n 2 r 0,..., r nh ; κ, θ, σ 2 n 1 σ 2 + 1 2 i=1 σ 2 θ r (i 1)h h 2 r ih r (i 1)h κ θ r (i 1)h h (σ 2 ) 2 h 75

III Preuve En posant ln f θ ln f θ ln f σ 2 r 0,..., r nh ; bκ, bθ, bσ 2 = 0 r 0,..., r nh ; bκ, bθ, bσ 2 = 0 r 0,..., r nh ; bκ, bθ, bσ 2 = 0 nous trouverons les estimateurs bκ, bθ et bσ 2. 76

IV Preuve En e et, posons S r = n i=1 r (i 1)h D r = n i=1 C r = n i=1 r 2 (i 1)h V r = n i=1 r (i 1)h De la première équation, nous déduisons que r ih r (i 1)h r ih r (i 1)h n r ih r (i 1)h bκ b θ r (i 1)h h = 0. i=1 77

V Preuve En isolant bκ dans les deux premières équations (utilisant la dernière équation pour la deuxième expression) et bσ 2 dans la troisième, nous obtenons bκ = 1 n i=1 r ih r (i 1)h h nbθ n i=1 r = 1 D r h (i 1)h nbθ S r bκ = 1 n i=1 r (i 1)h r ih r (i 1)h h bθ n i=1 r (i 1)h n i=1 r (i 2 = 1 V r h bθs 1)h r C r bσ 2 = 1 n 2 nh r ih r (i 1)h bκ b θ r (i 1)h h. i=1 Parce que les membres de droite des deux premières équations sont égaux, nous trouvons bθ = S r V r C r D r. nv r S r D r 78

VI Preuve Les dérivées secondes nécessaires à l estimation de la variance : = = = n 2 2 ln f θ 2 nhκ 2 σ 2 2 ln f κ 2 h σ 2 n i=1 r 0,..., r nh ; κ, θ, σ 2 r 0,..., r nh ; κ, θ, σ 2 θ r (i 1)h 2 2 ln f r (σ 2 ) 2 0,..., r nh ; κ, θ, σ 2 1 (σ 2 ) 2 n r ih r (i 1)h κ i=1 (σ 2 ) 3 h 2 θ r (i 1)h h 79

VII Preuve Les variances de nos estimateurs bθ, bκ, bσ 2 et bσ sont estimées respectivement par \ Var b θ = \Var (bκ) = \ Var bσ 2 = \Var (bσ) = 1 4 bσ 2 nhbκ 2, h n i=1 2 n i=1 bσ 2 2, b θ r (i 1)h r ih r (i 1)h bκ 1 \ Var bσ 2 bσ 2. 2h bσ 2 3 2, b θ r (i 1)h h nhbσ 2 80

I Estimateurs des 1. En isolant les Z i dans le processus original, il vient Z i = r (i+1)h r ih κ (θ r ih ) h. σh 2 1 2. La somme des erreurs au carré est une fonction des paramètres du modèle Q (κ, θ) = n Zi 2 = i=1 n i=1 r(i+1)h r ih κ (θ r ih ) h 2. σh 1 2 81

II Estimateurs des 3. Minimisons la fonction Q (κ, θ) : Q θ Q κ = 2 κ n σ 2 r (i+1)h r ih κ (θ r ih ) h i=1 = 2 1 σ 2 n i=1 r (i+1)h r ih κ (θ r ih ) h (θ r ih ) 82

III Estimateurs des 4. Solutionnons le système Q θ qui est équivalent à eκ, eθ = 0 et Q eκ, eθ = 0 κ n r (i+1)h r ih eκ e θ i=1 e θ n r (i+1)h r ih eκ i=1 r ih h e θ r ih h r ih = 0, = 0. 83

IV Estimateurs des 4.1 Ainsi, de la première équation, nous obtenons n i =1 r (i +1)h r ih = eκh. n e i =1 θ r ih 4.2 En substituant la première équation dans la deuxième, nous avons n i =1 r (i +1)h r ih r ih = eκh. n e i =1 θ r ih r ih 84

V Estimateurs des 4.3 Mais, n i =1 r (i +1)h r ih = n i =1 r (i +1)h r ih r ih n e i =1 θ r ih n e i =1 θ r ih r ih si et seulement si 4.4 Finalement, eθ = C r D r S r D r eκ = 1 h S r V r nv r D r neθ S r. 5. Il faudrait montrer que les résultats obtenus minimisent bien la fonction Q (calcul des dérivées secondes) 6. Ces estimateurs des sont les mêmes que les estimateurs obtenus par la méthode du maximum de. 85