La Méthode de Mote Carlo Etiee Pardoux UMR 6632 Laboratoire d Aalyse, Topologie, Probabilités et EA 3781 Evolutio Biologique Uiversité de Provece Etiee Pardoux (LATP) Marseille, 13/09/2006 1 / 33
Cotets 1 Itroductio 2 PILE ou FACE 3 Le mouvemet browie 4 Calcul du prix d ue optio e Fiace 5 Détermiatio d u arbre phylogéétique Etiee Pardoux (LATP) Marseille, 13/09/2006 2 / 33
Outlie 1 Itroductio 2 PILE ou FACE 3 Le mouvemet browie 4 Calcul du prix d ue optio e Fiace 5 Détermiatio d u arbre phylogéétique Etiee Pardoux (LATP) Marseille, 13/09/2006 3 / 33
Itroductio La méthode de Mote Carlo est ue méthode umérique, qui utilise des tirages aléatoires pour réaliser le calcul d ue quatité détermiiste. O verra deux applicatios de cette méthode pour 1 le calcul du prix d ue optio e Fiace ; 2 la détermiatio d u arbre phylogéétique à partir de doées géomiques ; et o expliquera les avatages de celle ci. Mais ous allos tout d abord préseter les cocepts de base du Calcul des Probabilités sur l exemple le plus simple : ue suite de tirages à PILE ou FACE, et le mouvemet browie. Etiee Pardoux (LATP) Marseille, 13/09/2006 4 / 33
Itroductio La méthode de Mote Carlo est ue méthode umérique, qui utilise des tirages aléatoires pour réaliser le calcul d ue quatité détermiiste. O verra deux applicatios de cette méthode pour 1 le calcul du prix d ue optio e Fiace ; 2 la détermiatio d u arbre phylogéétique à partir de doées géomiques ; et o expliquera les avatages de celle ci. Mais ous allos tout d abord préseter les cocepts de base du Calcul des Probabilités sur l exemple le plus simple : ue suite de tirages à PILE ou FACE, et le mouvemet browie. Etiee Pardoux (LATP) Marseille, 13/09/2006 4 / 33
Itroductio La méthode de Mote Carlo est ue méthode umérique, qui utilise des tirages aléatoires pour réaliser le calcul d ue quatité détermiiste. O verra deux applicatios de cette méthode pour 1 le calcul du prix d ue optio e Fiace ; 2 la détermiatio d u arbre phylogéétique à partir de doées géomiques ; et o expliquera les avatages de celle ci. Mais ous allos tout d abord préseter les cocepts de base du Calcul des Probabilités sur l exemple le plus simple : ue suite de tirages à PILE ou FACE, et le mouvemet browie. Etiee Pardoux (LATP) Marseille, 13/09/2006 4 / 33
Outlie 1 Itroductio 2 PILE ou FACE 3 Le mouvemet browie 4 Calcul du prix d ue optio e Fiace 5 Détermiatio d u arbre phylogéétique Etiee Pardoux (LATP) Marseille, 13/09/2006 5 / 33
Formalisatio du jeu de PILE ou FACE Supposos que l o joue fois de suite à PILE ou FACE avec ue pièce telle que Proba(PILE) = p, Proba(FACE) = 1 p, avec u certai 0 < p < 1. O formalise cette expériece aléatoire e défiissat comme suit le résultat du k ième jet { 1, si o obtiet PILE au k ième coup; X k = 0, si l o obtiet FACE au k ième coup. La LOI DES GRANDS NOMBRES du Calcul des Probabilités ous eseige que quad est grad, la proportio de PILE obteus est proche de p, soit X 1 + + X p. Doc la proportio de PILE obteus e coups peut être utilisé pour estimer p, que ous allos cosidérer comme INCONNU. Etiee Pardoux (LATP) Marseille, 13/09/2006 6 / 33
Formalisatio du jeu de PILE ou FACE Supposos que l o joue fois de suite à PILE ou FACE avec ue pièce telle que Proba(PILE) = p, Proba(FACE) = 1 p, avec u certai 0 < p < 1. O formalise cette expériece aléatoire e défiissat comme suit le résultat du k ième jet { 1, si o obtiet PILE au k ième coup; X k = 0, si l o obtiet FACE au k ième coup. La LOI DES GRANDS NOMBRES du Calcul des Probabilités ous eseige que quad est grad, la proportio de PILE obteus est proche de p, soit X 1 + + X p. Doc la proportio de PILE obteus e coups peut être utilisé pour estimer p, que ous allos cosidérer comme INCONNU. Etiee Pardoux (LATP) Marseille, 13/09/2006 6 / 33
Formalisatio du jeu de PILE ou FACE Supposos que l o joue fois de suite à PILE ou FACE avec ue pièce telle que Proba(PILE) = p, Proba(FACE) = 1 p, avec u certai 0 < p < 1. O formalise cette expériece aléatoire e défiissat comme suit le résultat du k ième jet { 1, si o obtiet PILE au k ième coup; X k = 0, si l o obtiet FACE au k ième coup. La LOI DES GRANDS NOMBRES du Calcul des Probabilités ous eseige que quad est grad, la proportio de PILE obteus est proche de p, soit X 1 + + X p. Doc la proportio de PILE obteus e coups peut être utilisé pour estimer p, que ous allos cosidérer comme INCONNU. Etiee Pardoux (LATP) Marseille, 13/09/2006 6 / 33
Loi des Grads Nombres U calcul classique doe [ (X1 ) ] [ + + X 2 (X1 p Esp p = Esp + + X ) ] p 2 [ (X1 ) p 2 ( ) ] X p 2 (par l idépedace des X k ) = Esp + + = 2 Esp[(X 1 p) 2 ] p(1 p) = 0, quad Détail du calcul de Var(X 1 ) = Esp[(X 1 p) 2 ] : Var(X 1 ) = p (1 p) 2 + (1 p) p 2 = p p 2. O a e fait u résultat plus précis. Etiee Pardoux (LATP) Marseille, 13/09/2006 7 / 33
Loi des Grads Nombres U calcul classique doe [ (X1 ) ] [ + + X 2 (X1 p Esp p = Esp + + X ) ] p 2 [ (X1 ) p 2 ( ) ] X p 2 (par l idépedace des X k ) = Esp + + = 2 Esp[(X 1 p) 2 ] p(1 p) = 0, quad Détail du calcul de Var(X 1 ) = Esp[(X 1 p) 2 ] : Var(X 1 ) = p (1 p) 2 + (1 p) p 2 = p p 2. O a e fait u résultat plus précis. Etiee Pardoux (LATP) Marseille, 13/09/2006 7 / 33
Loi des Grads Nombres U calcul classique doe [ (X1 ) ] [ + + X 2 (X1 p Esp p = Esp + + X ) ] p 2 [ (X1 ) p 2 ( ) ] X p 2 (par l idépedace des X k ) = Esp + + = 2 Esp[(X 1 p) 2 ] p(1 p) = 0, quad Détail du calcul de Var(X 1 ) = Esp[(X 1 p) 2 ] : Var(X 1 ) = p (1 p) 2 + (1 p) p 2 = p p 2. O a e fait u résultat plus précis. Etiee Pardoux (LATP) Marseille, 13/09/2006 7 / 33
Théorème de de Moivre Le Théorème de de Moivre (1718) ous dit que ( ( X1 + + X Proba a < p(1 p ) ) p < b 1 b e x2 /2 dx. 2π a E particulier, Proba ( X 1 + + X ) p p(1 p) > c 2 e x2 /2 dx. 2π c Notos que le membre de droite vaut 0, 05 si c = 1, 96, et 0, 01 si c = 2, 6. Etiee Pardoux (LATP) Marseille, 13/09/2006 8 / 33
Théorème de de Moivre Le Théorème de de Moivre (1718) ous dit que ( ( X1 + + X Proba a < p(1 p ) ) p < b 1 b e x2 /2 dx. 2π a E particulier, Proba ( X 1 + + X ) p p(1 p) > c 2 e x2 /2 dx. 2π c Notos que le membre de droite vaut 0, 05 si c = 1, 96, et 0, 01 si c = 2, 6. Etiee Pardoux (LATP) Marseille, 13/09/2006 8 / 33
Itervalle de cofiace Mais p est INCONNU! Cepedat o sait que pour 0 < p < 1, p(1 p) 1/4, doc p(1 p) 1/2. D où l o déduit (e choisissat par exemple c = 1, 96 ( X 1 + + X Proba p > 0, 98 ) 0, 05, où o a u petit peu triché, mais c est essetiellemet vrai dès que p > 10. Autremet dit, [ X1 + + X Proba ( p 0, 98, X ]) 1 + + X 0, 98 + 0, 95. Il y a aucu itervalle boré de IR dot o puisse dire avec certitude qu il cotiet p, mais il y a des itervalles dits itervalle de cofiace, dot o peut dire qu il cotieet p avec ue probabilité très proche de 1. Etiee Pardoux (LATP) Marseille, 13/09/2006 9 / 33
Itervalle de cofiace Mais p est INCONNU! Cepedat o sait que pour 0 < p < 1, p(1 p) 1/4, doc p(1 p) 1/2. D où l o déduit (e choisissat par exemple c = 1, 96 ( X 1 + + X Proba p > 0, 98 ) 0, 05, où o a u petit peu triché, mais c est essetiellemet vrai dès que p > 10. Autremet dit, [ X1 + + X Proba ( p 0, 98, X ]) 1 + + X 0, 98 + 0, 95. Il y a aucu itervalle boré de IR dot o puisse dire avec certitude qu il cotiet p, mais il y a des itervalles dits itervalle de cofiace, dot o peut dire qu il cotieet p avec ue probabilité très proche de 1. Etiee Pardoux (LATP) Marseille, 13/09/2006 9 / 33
Itervalle de cofiace Mais p est INCONNU! Cepedat o sait que pour 0 < p < 1, p(1 p) 1/4, doc p(1 p) 1/2. D où l o déduit (e choisissat par exemple c = 1, 96 ( X 1 + + X Proba p > 0, 98 ) 0, 05, où o a u petit peu triché, mais c est essetiellemet vrai dès que p > 10. Autremet dit, [ X1 + + X Proba ( p 0, 98, X ]) 1 + + X 0, 98 + 0, 95. Il y a aucu itervalle boré de IR dot o puisse dire avec certitude qu il cotiet p, mais il y a des itervalles dits itervalle de cofiace, dot o peut dire qu il cotieet p avec ue probabilité très proche de 1. Etiee Pardoux (LATP) Marseille, 13/09/2006 9 / 33
Outlie 1 Itroductio 2 PILE ou FACE 3 Le mouvemet browie 4 Calcul du prix d ue optio e Fiace 5 Détermiatio d u arbre phylogéétique Etiee Pardoux (LATP) Marseille, 13/09/2006 10 / 33
Mouvemet browie Il s agit d ue processus stochastique (i. e. ue foctio aléatoire du temps) qui a été itroduit par le botaiste R. Brow au début du 19ème siècle pour modéliser les mouvemets de grais de polle e suspesio, étudié esuite au 20ème siècle par A. Eistei, M. Smoluchowsky, N. Wieer, P. Lévy,... La particularité du mouvemet browie est que ses accroissemets sot idépedats, ce qui red ses trajectoires très irrégulières (sa vitesse est ifiie e tout poit). Le mouvemet browie est utilisé das de ombreux modèles de phéomèes physiques. Il permet aussi de doer ue expressio de la solutio de l équatio de la chaleur. Etiee Pardoux (LATP) Marseille, 13/09/2006 11 / 33
Mouvemet browie Il s agit d ue processus stochastique (i. e. ue foctio aléatoire du temps) qui a été itroduit par le botaiste R. Brow au début du 19ème siècle pour modéliser les mouvemets de grais de polle e suspesio, étudié esuite au 20ème siècle par A. Eistei, M. Smoluchowsky, N. Wieer, P. Lévy,... La particularité du mouvemet browie est que ses accroissemets sot idépedats, ce qui red ses trajectoires très irrégulières (sa vitesse est ifiie e tout poit). Le mouvemet browie est utilisé das de ombreux modèles de phéomèes physiques. Il permet aussi de doer ue expressio de la solutio de l équatio de la chaleur. Etiee Pardoux (LATP) Marseille, 13/09/2006 11 / 33
Mouvemet browie Il s agit d ue processus stochastique (i. e. ue foctio aléatoire du temps) qui a été itroduit par le botaiste R. Brow au début du 19ème siècle pour modéliser les mouvemets de grais de polle e suspesio, étudié esuite au 20ème siècle par A. Eistei, M. Smoluchowsky, N. Wieer, P. Lévy,... La particularité du mouvemet browie est que ses accroissemets sot idépedats, ce qui red ses trajectoires très irrégulières (sa vitesse est ifiie e tout poit). Le mouvemet browie est utilisé das de ombreux modèles de phéomèes physiques. Il permet aussi de doer ue expressio de la solutio de l équatio de la chaleur. Etiee Pardoux (LATP) Marseille, 13/09/2006 11 / 33
Ue trajectoire typique du mouvemet browie 1 1 Ue trajectoire du mouvemet browie, de t=0 à t =5 0.5 0 0.5 1 1.5 2 2.5 0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 5 t Etiee Pardoux (LATP) Marseille, 13/09/2006 12 / 33
Ue trajectoire typique du mouvemet browie 2 1.5 Ue trajectoire du mouvemet browie, de t=0 à t =5 1 0.5 0 0.5 1 1.5 0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 5 t Etiee Pardoux (LATP) Marseille, 13/09/2006 13 / 33
Ue trajectoire typique du mouvemet browie 3 2.5 Ue trajectoire du mouvemet browie, de t=0 à t =5 2 1.5 1 0.5 0 0.5 1 1.5 0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 5 t Etiee Pardoux (LATP) Marseille, 13/09/2006 14 / 33
Outlie 1 Itroductio 2 PILE ou FACE 3 Le mouvemet browie 4 Calcul du prix d ue optio e Fiace 5 Détermiatio d u arbre phylogéétique Etiee Pardoux (LATP) Marseille, 13/09/2006 15 / 33
Le modèle de Black Scholes Supposos qu il existe deux actifs accessibles sur le marché : u actif o risqué (ex. placemet à la Caisse d Eparge), dot le prix à l istat t est S 0 (t) = S 0 (0) exp(rt); où r est le taux d itérêt ; u actif risqué (ex. ue actio e bourse), dot le prix à l istat t est S(t) = S(0) exp(λt + σb(t)), où λ est u paramètre de tedace, σ la volatilité, {B(t), t 0} est u mouvemet browie. Etiee Pardoux (LATP) Marseille, 13/09/2006 16 / 33
Le modèle de Black Scholes Supposos qu il existe deux actifs accessibles sur le marché : u actif o risqué (ex. placemet à la Caisse d Eparge), dot le prix à l istat t est S 0 (t) = S 0 (0) exp(rt); où r est le taux d itérêt ; u actif risqué (ex. ue actio e bourse), dot le prix à l istat t est S(t) = S(0) exp(λt + σb(t)), où λ est u paramètre de tedace, σ la volatilité, {B(t), t 0} est u mouvemet browie. Etiee Pardoux (LATP) Marseille, 13/09/2006 16 / 33
Optio Ue optio est u cotrat qui doe le droit (pas l obligatio) d acheter (ou de vedre) à l échéace T uités de l actif risqué, à u prix K fixé à l avace. Le but de ce cotrat est de couvrir so acquéreur vis à vis de fluctuatios à la hausse (ou à la baisse) de cet actif risqué, etre l istat préset t = 0 et l échéace t = T. L acquéreur de cette optio doit payer ue prime au momet de la sigature du cotrat. Etiee Pardoux (LATP) Marseille, 13/09/2006 17 / 33
Optio Ue optio est u cotrat qui doe le droit (pas l obligatio) d acheter (ou de vedre) à l échéace T uités de l actif risqué, à u prix K fixé à l avace. Le but de ce cotrat est de couvrir so acquéreur vis à vis de fluctuatios à la hausse (ou à la baisse) de cet actif risqué, etre l istat préset t = 0 et l échéace t = T. L acquéreur de cette optio doit payer ue prime au momet de la sigature du cotrat. Etiee Pardoux (LATP) Marseille, 13/09/2006 17 / 33
Optio Ue optio est u cotrat qui doe le droit (pas l obligatio) d acheter (ou de vedre) à l échéace T uités de l actif risqué, à u prix K fixé à l avace. Le but de ce cotrat est de couvrir so acquéreur vis à vis de fluctuatios à la hausse (ou à la baisse) de cet actif risqué, etre l istat préset t = 0 et l échéace t = T. L acquéreur de cette optio doit payer ue prime au momet de la sigature du cotrat. Etiee Pardoux (LATP) Marseille, 13/09/2006 17 / 33
Formule de Black Scholes Le juste prix de l optio (par uité d actif à acheter ou à vedre) est doé par la célèbre formule de Black Scholes (1972) Das le cas d ue optio d achat (call e Aglais) [( ) σ2 [σb(t ) C = Esp e 2 T ] e rt K + ]. Das le cas d ue optio de vete (put e Aglais) [( ) ] P = Esp e rt σ2 [σb(t ) K e 2 T ]. + O va cosidérer ci dessous le cas d ue optio de vete. Etiee Pardoux (LATP) Marseille, 13/09/2006 18 / 33
Formule de Black Scholes Le juste prix de l optio (par uité d actif à acheter ou à vedre) est doé par la célèbre formule de Black Scholes (1972) Das le cas d ue optio d achat (call e Aglais) [( ) σ2 [σb(t ) C = Esp e 2 T ] e rt K + ]. Das le cas d ue optio de vete (put e Aglais) [( ) ] P = Esp e rt σ2 [σb(t ) K e 2 T ]. + O va cosidérer ci dessous le cas d ue optio de vete. Etiee Pardoux (LATP) Marseille, 13/09/2006 18 / 33
Formule de Black Scholes Le juste prix de l optio (par uité d actif à acheter ou à vedre) est doé par la célèbre formule de Black Scholes (1972) Das le cas d ue optio d achat (call e Aglais) [( ) σ2 [σb(t ) C = Esp e 2 T ] e rt K + ]. Das le cas d ue optio de vete (put e Aglais) [( ) ] P = Esp e rt σ2 [σb(t ) K e 2 T ]. + O va cosidérer ci dessous le cas d ue optio de vete. Etiee Pardoux (LATP) Marseille, 13/09/2006 18 / 33
Calcul du prix d ue optio de vete par Mote Carlo Das le cas ci dessus, o a ue formule explicite pour la valeur P d ue optio de vete, e foctio des paramètres r, σ, T et K. Das la figure ci dessous, o compare la valeur exacte avec le résultat du calcul de Mote Carlo, et les bores de l itervalle de cofiace, e foctio du ombre N de simulatios. Etiee Pardoux (LATP) Marseille, 13/09/2006 19 / 33
Calcul du prix d ue optio de vete par Mote Carlo Das le cas ci dessus, o a ue formule explicite pour la valeur P d ue optio de vete, e foctio des paramètres r, σ, T et K. Das la figure ci dessous, o compare la valeur exacte avec le résultat du calcul de Mote Carlo, et les bores de l itervalle de cofiace, e foctio du ombre N de simulatios. Etiee Pardoux (LATP) Marseille, 13/09/2006 19 / 33
Résultat umérique 0.5 0.4 0.3 0.2 0.1 0 0 100 200 300 400 500 600 700 800 900 1000 Etiee Pardoux (LATP) Marseille, 13/09/2006 20 / 33
Optio paier Supposos cette fois que l o dispose sur le marché de 10 actifs risqués, chacu fluctuat e foctio d u mouvemet browie différet, avec ue volatilité propre. Cosidéros ue optio de vete sur u paier de ces 10 actios, qui cosiste e u cotrat aux termes duquel le vedeur de l actio s egage à vous acheter à l échéace T au prix fixé K a i uités de l actio uméro i, de i = 1 à i = 10. La formule de Black Scholes doe comme prix ( ) 10 P = Esp e rt K a i e [σ i B i (T ) σ 2 i 2 T ]. i=1 + Etiee Pardoux (LATP) Marseille, 13/09/2006 21 / 33
Optio paier Supposos cette fois que l o dispose sur le marché de 10 actifs risqués, chacu fluctuat e foctio d u mouvemet browie différet, avec ue volatilité propre. Cosidéros ue optio de vete sur u paier de ces 10 actios, qui cosiste e u cotrat aux termes duquel le vedeur de l actio s egage à vous acheter à l échéace T au prix fixé K a i uités de l actio uméro i, de i = 1 à i = 10. La formule de Black Scholes doe comme prix ( ) 10 P = Esp e rt K a i e [σ i B i (T ) σ 2 i 2 T ]. i=1 + Etiee Pardoux (LATP) Marseille, 13/09/2006 21 / 33
Optio paier Supposos cette fois que l o dispose sur le marché de 10 actifs risqués, chacu fluctuat e foctio d u mouvemet browie différet, avec ue volatilité propre. Cosidéros ue optio de vete sur u paier de ces 10 actios, qui cosiste e u cotrat aux termes duquel le vedeur de l actio s egage à vous acheter à l échéace T au prix fixé K a i uités de l actio uméro i, de i = 1 à i = 10. La formule de Black Scholes doe comme prix ( ) 10 P = Esp e rt K a i e [σ i B i (T ) σ 2 i 2 T ]. i=1 + Etiee Pardoux (LATP) Marseille, 13/09/2006 21 / 33
Résultat umérique 2.1 2 1.9 1.8 1.7 1.6 1.5 1.4 1.3 1.2 0 1000 2000 3000 4000 5000 6000 7000 8000 9000 10000 Etiee Pardoux (LATP) Marseille, 13/09/2006 22 / 33
Commetaire Das le cas de l optio paier, o a pas de formule excate pour le calcul du prix de l optio. Ue méthode umérique basée sur ue équatio aux dérivées partielles est totalemet impossible à mettre e oeuvre : il faudrait résoudre ue équatio e dimesio d espace égale à dix! Das cet exemple, la méthode de Mote Carlo motre toute sa puissace et sa souplesse d utilisatio. Elle est quasimet aussi facile à programmer que la méthode das le cas d ue seule actio, et demade seulemet u peu plus de temps de calcul et d espace mémoire. Etiee Pardoux (LATP) Marseille, 13/09/2006 23 / 33
Commetaire Das le cas de l optio paier, o a pas de formule excate pour le calcul du prix de l optio. Ue méthode umérique basée sur ue équatio aux dérivées partielles est totalemet impossible à mettre e oeuvre : il faudrait résoudre ue équatio e dimesio d espace égale à dix! Das cet exemple, la méthode de Mote Carlo motre toute sa puissace et sa souplesse d utilisatio. Elle est quasimet aussi facile à programmer que la méthode das le cas d ue seule actio, et demade seulemet u peu plus de temps de calcul et d espace mémoire. Etiee Pardoux (LATP) Marseille, 13/09/2006 23 / 33
Outlie 1 Itroductio 2 PILE ou FACE 3 Le mouvemet browie 4 Calcul du prix d ue optio e Fiace 5 Détermiatio d u arbre phylogéétique Etiee Pardoux (LATP) Marseille, 13/09/2006 24 / 33
U problème modèle O sait que les trois espèces Homme Chimpazé Gorille sot très proches (plus proches etre elles que de touters les autres expèces). O voudrait décider laquelle de ces trois formes d arbre correspod à la réalité de l histoire des espèces : Gorille Homme Homme Chimp Gorille Chimp Homme Chimp Gorille Etiee Pardoux (LATP) Marseille, 13/09/2006 25 / 33
U problème modèle O sait que les trois espèces Homme Chimpazé Gorille sot très proches (plus proches etre elles que de touters les autres expèces). O voudrait décider laquelle de ces trois formes d arbre correspod à la réalité de l histoire des espèces : Gorille Homme Homme Chimp Gorille Chimp Homme Chimp Gorille Etiee Pardoux (LATP) Marseille, 13/09/2006 25 / 33
Les doées Pour cela, o compare des portios des géomes de ces trois espèces, préalablemet aligées. Ue méthode statistique de plus e plus prisée pour détermier le bo arbre phylogéétique est la méthode de Bayes, qui cosiste à se doer ue probabilité a priori sur les trois formes d arbre possibles, par exemple 1/3 1/3 1/3, et à calculer, à l aide de la formule de Bayes ue probabilité dite a posteriori, c est à dire preat e compte les doées. Pour i = 1, 2, 3, Proba (Arbre i) Proba (Doées Arbre i) Proba (Arbre i Doées) = Proba (Doées) Proba (Arbre i) Proba (Doées Arbre i) = 3 j=1 Proba (Arbre j) Proba (Doées Arbre j) Etiee Pardoux (LATP) Marseille, 13/09/2006 26 / 33
Les doées Pour cela, o compare des portios des géomes de ces trois espèces, préalablemet aligées. Ue méthode statistique de plus e plus prisée pour détermier le bo arbre phylogéétique est la méthode de Bayes, qui cosiste à se doer ue probabilité a priori sur les trois formes d arbre possibles, par exemple 1/3 1/3 1/3, et à calculer, à l aide de la formule de Bayes ue probabilité dite a posteriori, c est à dire preat e compte les doées. Pour i = 1, 2, 3, Proba (Arbre i) Proba (Doées Arbre i) Proba (Arbre i Doées) = Proba (Doées) Proba (Arbre i) Proba (Doées Arbre i) = 3 j=1 Proba (Arbre j) Proba (Doées Arbre j) Etiee Pardoux (LATP) Marseille, 13/09/2006 26 / 33
Les doées Pour cela, o compare des portios des géomes de ces trois espèces, préalablemet aligées. Ue méthode statistique de plus e plus prisée pour détermier le bo arbre phylogéétique est la méthode de Bayes, qui cosiste à se doer ue probabilité a priori sur les trois formes d arbre possibles, par exemple 1/3 1/3 1/3, et à calculer, à l aide de la formule de Bayes ue probabilité dite a posteriori, c est à dire preat e compte les doées. Pour i = 1, 2, 3, Proba (Arbre i) Proba (Doées Arbre i) Proba (Arbre i Doées) = Proba (Doées) Proba (Arbre i) Proba (Doées Arbre i) = 3 j=1 Proba (Arbre j) Proba (Doées Arbre j) Etiee Pardoux (LATP) Marseille, 13/09/2006 26 / 33
Calcul de la formule de Bayes Das cette formule, Proba(Arbre i) est la probabilité a priori que l o s est doée (ici (1/3, 1/3, 1/3)). Proba (Doées Arbre i) est la probabilité d observer les doées, si i est la forme de l arbre. Cette quatité se calcule à l aide d u modèle probabiliste d évolutio des géomes. E pratique, la somme qui apparaît au déomiateur est ue somme sur u ombre gigatesque de termes! E effet Etiee Pardoux (LATP) Marseille, 13/09/2006 27 / 33
Calcul de la formule de Bayes Das cette formule, Proba(Arbre i) est la probabilité a priori que l o s est doée (ici (1/3, 1/3, 1/3)). Proba (Doées Arbre i) est la probabilité d observer les doées, si i est la forme de l arbre. Cette quatité se calcule à l aide d u modèle probabiliste d évolutio des géomes. E pratique, la somme qui apparaît au déomiateur est ue somme sur u ombre gigatesque de termes! E effet Etiee Pardoux (LATP) Marseille, 13/09/2006 27 / 33
Calcul de la formule de Bayes Das cette formule, Proba(Arbre i) est la probabilité a priori que l o s est doée (ici (1/3, 1/3, 1/3)). Proba (Doées Arbre i) est la probabilité d observer les doées, si i est la forme de l arbre. Cette quatité se calcule à l aide d u modèle probabiliste d évolutio des géomes. E pratique, la somme qui apparaît au déomiateur est ue somme sur u ombre gigatesque de termes! E effet Etiee Pardoux (LATP) Marseille, 13/09/2006 27 / 33
Ue difficulté O traite e gééral beaucoup plus que 3 espèces, et le ombre d arbres possibles croît de faço dramatique avec le ombre d espèces cosidérées. Nombre d espèces 4 15 5 105 6 945 Nombre d arbres possibles 7 > 10 4 10 > 34 10 6 20 8, 2 10 21 Il e suffit pas de sommer sur les formes possibles d arbre, il faut aussi predre e compte les logueurs des braches, et les paramètres du modèle probabiliste d évolutio. Etiee Pardoux (LATP) Marseille, 13/09/2006 28 / 33
Ue difficulté O traite e gééral beaucoup plus que 3 espèces, et le ombre d arbres possibles croît de faço dramatique avec le ombre d espèces cosidérées. Nombre d espèces 4 15 5 105 6 945 Nombre d arbres possibles 7 > 10 4 10 > 34 10 6 20 8, 2 10 21 Il e suffit pas de sommer sur les formes possibles d arbre, il faut aussi predre e compte les logueurs des braches, et les paramètres du modèle probabiliste d évolutio. Etiee Pardoux (LATP) Marseille, 13/09/2006 28 / 33
Commet simuler sous ue probabilité impossible à calculer? Pour calculer la probabilité a posteriori par Mote Carlo, il faudrait réaliser des tirages aléatoires sous ue probabilité doée par la formule de Bayes. Seul le umérateur de cette formule peut être calculé. Autremet dit, o voudrait réaliser des tirages aléatoires sous ue probabilité que l o coaît seulemet à ue costate de ormalisatio près, que l o est icapable de calculer. Etiee Pardoux (LATP) Marseille, 13/09/2006 29 / 33
Commet simuler sous ue probabilité impossible à calculer? Pour calculer la probabilité a posteriori par Mote Carlo, il faudrait réaliser des tirages aléatoires sous ue probabilité doée par la formule de Bayes. Seul le umérateur de cette formule peut être calculé. Autremet dit, o voudrait réaliser des tirages aléatoires sous ue probabilité que l o coaît seulemet à ue costate de ormalisatio près, que l o est icapable de calculer. Etiee Pardoux (LATP) Marseille, 13/09/2006 29 / 33
Commet simuler sous ue probabilité impossible à calculer? Pour calculer la probabilité a posteriori par Mote Carlo, il faudrait réaliser des tirages aléatoires sous ue probabilité doée par la formule de Bayes. Seul le umérateur de cette formule peut être calculé. Autremet dit, o voudrait réaliser des tirages aléatoires sous ue probabilité que l o coaît seulemet à ue costate de ormalisatio près, que l o est icapable de calculer. Etiee Pardoux (LATP) Marseille, 13/09/2006 29 / 33
Mote Carlo par chaîe de Markov La solutio à ce problème a été ivetée par des Physicies dès 1953, et c est grâce à cette ivetio que la statistique bayésiee est utilisable aujourd hui! Ue chaîe de Markov est ue suite de v. a. {X } de la forme X +1 = f (X, Y ), où les Y formet ue suite idépedate. Sous des hypothèses très faibles, ue chaîe de Markov possède ue uique probablité ivariate π, et la suite {X } satisfait ue loi des grads ombres : g(x 1 ) + + g(x ) x g(x)π(x) Efi, il est pas difficile de choisir la boe chaîe de Markov, si l o coaît π à ue costate multiplicative près. Etiee Pardoux (LATP) Marseille, 13/09/2006 30 / 33
Mote Carlo par chaîe de Markov La solutio à ce problème a été ivetée par des Physicies dès 1953, et c est grâce à cette ivetio que la statistique bayésiee est utilisable aujourd hui! Ue chaîe de Markov est ue suite de v. a. {X } de la forme X +1 = f (X, Y ), où les Y formet ue suite idépedate. Sous des hypothèses très faibles, ue chaîe de Markov possède ue uique probablité ivariate π, et la suite {X } satisfait ue loi des grads ombres : g(x 1 ) + + g(x ) x g(x)π(x) Efi, il est pas difficile de choisir la boe chaîe de Markov, si l o coaît π à ue costate multiplicative près. Etiee Pardoux (LATP) Marseille, 13/09/2006 30 / 33
Mote Carlo par chaîe de Markov La solutio à ce problème a été ivetée par des Physicies dès 1953, et c est grâce à cette ivetio que la statistique bayésiee est utilisable aujourd hui! Ue chaîe de Markov est ue suite de v. a. {X } de la forme X +1 = f (X, Y ), où les Y formet ue suite idépedate. Sous des hypothèses très faibles, ue chaîe de Markov possède ue uique probablité ivariate π, et la suite {X } satisfait ue loi des grads ombres : g(x 1 ) + + g(x ) x g(x)π(x) Efi, il est pas difficile de choisir la boe chaîe de Markov, si l o coaît π à ue costate multiplicative près. Etiee Pardoux (LATP) Marseille, 13/09/2006 30 / 33
Mote Carlo par chaîe de Markov La solutio à ce problème a été ivetée par des Physicies dès 1953, et c est grâce à cette ivetio que la statistique bayésiee est utilisable aujourd hui! Ue chaîe de Markov est ue suite de v. a. {X } de la forme X +1 = f (X, Y ), où les Y formet ue suite idépedate. Sous des hypothèses très faibles, ue chaîe de Markov possède ue uique probablité ivariate π, et la suite {X } satisfait ue loi des grads ombres : g(x 1 ) + + g(x ) x g(x)π(x) Efi, il est pas difficile de choisir la boe chaîe de Markov, si l o coaît π à ue costate multiplicative près. Etiee Pardoux (LATP) Marseille, 13/09/2006 30 / 33
L algorithme de Metropolis Hastigs Plus précisémet, état doée ue loi de trasitio markoviee de la forme q(x, y) = Proba (Y +1 = y Y = x), pour passer de X à X +1, o simule d abord ue trasitio selo q(x, y), et si cette trasitio cosiste à faire passer de x à y, o accepte cette trasitio avec la probabilité π(y)q(y, x) mi{ π(x)q(x, y), 1}, (si o la refuse, o pose X +1 = X ). Notos que la coaissace des π(x) à ue costate multiplicative près suffit. Etiee Pardoux (LATP) Marseille, 13/09/2006 31 / 33
L algorithme de Metropolis Hastigs Plus précisémet, état doée ue loi de trasitio markoviee de la forme q(x, y) = Proba (Y +1 = y Y = x), pour passer de X à X +1, o simule d abord ue trasitio selo q(x, y), et si cette trasitio cosiste à faire passer de x à y, o accepte cette trasitio avec la probabilité π(y)q(y, x) mi{ π(x)q(x, y), 1}, (si o la refuse, o pose X +1 = X ). Notos que la coaissace des π(x) à ue costate multiplicative près suffit. Etiee Pardoux (LATP) Marseille, 13/09/2006 31 / 33
L algorithme de Metropolis Hastigs Plus précisémet, état doée ue loi de trasitio markoviee de la forme q(x, y) = Proba (Y +1 = y Y = x), pour passer de X à X +1, o simule d abord ue trasitio selo q(x, y), et si cette trasitio cosiste à faire passer de x à y, o accepte cette trasitio avec la probabilité π(y)q(y, x) mi{ π(x)q(x, y), 1}, (si o la refuse, o pose X +1 = X ). Notos que la coaissace des π(x) à ue costate multiplicative près suffit. Etiee Pardoux (LATP) Marseille, 13/09/2006 31 / 33
Avatages et difficultés de cette méthode U gros avatage de la méthode bayésiee de détermiatio d u arbre phylogéétique est que l o obtiet o pas u uique arbre, sas savoir quelle cofiace o peut attribuer à ce résultat, mais ue loi de probabilité sur les arbres. Par exemple, das le cas des 3 espèces Homme, Gorille, Chimpazé, o déduit des doées la loi a posteriori 2 10, 1 10, 7 10, ce qui idique quelle cofiace o peut avoir das la décisio de décider que c est le 3ème arbre qui correspod à l histoire des espèces. Mais d u autre coté, o maque de résultats qui doet des règles précises quad à la faço de meer les calculs, e particulier combie de fois il faut itérer la simulatio de la chaîe de Markov X. Etiee Pardoux (LATP) Marseille, 13/09/2006 32 / 33
Avatages et difficultés de cette méthode U gros avatage de la méthode bayésiee de détermiatio d u arbre phylogéétique est que l o obtiet o pas u uique arbre, sas savoir quelle cofiace o peut attribuer à ce résultat, mais ue loi de probabilité sur les arbres. Par exemple, das le cas des 3 espèces Homme, Gorille, Chimpazé, o déduit des doées la loi a posteriori 2 10, 1 10, 7 10, ce qui idique quelle cofiace o peut avoir das la décisio de décider que c est le 3ème arbre qui correspod à l histoire des espèces. Mais d u autre coté, o maque de résultats qui doet des règles précises quad à la faço de meer les calculs, e particulier combie de fois il faut itérer la simulatio de la chaîe de Markov X. Etiee Pardoux (LATP) Marseille, 13/09/2006 32 / 33
Avatages et difficultés de cette méthode U gros avatage de la méthode bayésiee de détermiatio d u arbre phylogéétique est que l o obtiet o pas u uique arbre, sas savoir quelle cofiace o peut attribuer à ce résultat, mais ue loi de probabilité sur les arbres. Par exemple, das le cas des 3 espèces Homme, Gorille, Chimpazé, o déduit des doées la loi a posteriori 2 10, 1 10, 7 10, ce qui idique quelle cofiace o peut avoir das la décisio de décider que c est le 3ème arbre qui correspod à l histoire des espèces. Mais d u autre coté, o maque de résultats qui doet des règles précises quad à la faço de meer les calculs, e particulier combie de fois il faut itérer la simulatio de la chaîe de Markov X. Etiee Pardoux (LATP) Marseille, 13/09/2006 32 / 33
Coclusio Autremet dit, les diverses scieces (e particulier la Biologie) ot besoi de mathématicies (vous demai?) qui fasset avacer la coaissace des algorithmes de type Mote Carlo, e particulier Mote Carlo par chaîes de Markov. C est u exemple de plus du fait que les progrès des ordiateurs egedret des besois de progrès e mathématique. Merci pour votre attetio. Etiee Pardoux (LATP) Marseille, 13/09/2006 33 / 33
Coclusio Autremet dit, les diverses scieces (e particulier la Biologie) ot besoi de mathématicies (vous demai?) qui fasset avacer la coaissace des algorithmes de type Mote Carlo, e particulier Mote Carlo par chaîes de Markov. C est u exemple de plus du fait que les progrès des ordiateurs egedret des besois de progrès e mathématique. Merci pour votre attetio. Etiee Pardoux (LATP) Marseille, 13/09/2006 33 / 33
Coclusio Autremet dit, les diverses scieces (e particulier la Biologie) ot besoi de mathématicies (vous demai?) qui fasset avacer la coaissace des algorithmes de type Mote Carlo, e particulier Mote Carlo par chaîes de Markov. C est u exemple de plus du fait que les progrès des ordiateurs egedret des besois de progrès e mathématique. Merci pour votre attetio. Etiee Pardoux (LATP) Marseille, 13/09/2006 33 / 33