THEOREMES D ARRETS POUR LES MARTINGALES

THEOREMES D ARRETS POUR LES MARTINGALES PRÉPARATION À L AGRÉGATION EXTERNE DE MATHÉMATIQUES DE L UNIVERSITÉ RENNES 1 1 ANNÉE 2011/2012 1. EQUI-NTEGRABILITE Les propriétés de cette section sont valables pour toute suite de v.a.r. Définition 1.1 Une famille (X i i I de v.a.r. est dite équi-intégrable (EI ou uniformément intégrable si Propriétés 1.1 lim sup k i I (1. Si (X i i I est EI, elle est aussi bornée dans L 1 ; E[ X i 1 ( Xi k] = 0. (2. Si il existe ε > 0 tel que sup i I E[ X i 1+ε ] <, (X i i I est EI ; (3. Si sup i I X i L 1, (X i i I est EI ; (4. Pour toute v.a.r. intégrable Z, la famille {E[Z B], B sous-tribu} est EI. Le résultat fondamental suivant s apparente à un théorème de type "convergence dominée" : P L Théorème 1.1 Soient (X n n et X des v.a.r. Si X n X, on a : (Xn n est EI X 1 n X. 2. CONVERGENCE L 1 DES MARTINGALES Théorème 2.1 Soit (X n n une sous-martingale. Alors, (X n n est EI (X n n converge p.s. et dans L 1. La martingale de Galton-Watson 2 (Z n /m n n 0 est EI si la loi de reproduction, i.e. la loi de ξ1 1, est de carré intégrable et m = Eξ1 1 > 1 : en effet, on peut montrer que EZ2 n+1 = var(ξ +m2 EZn, 2 et donc que (Z n /m n n 0 est borné dans L 2. Il existe donc une v.a.r. intégrable W (non nulle telle que l on ait p.s. : Z n m n W. Théorème 2.2 Soit (X n n une (F n n -sous-martingale EI et X sa limite. Alors n : X n E[X F n ] p.s. Lorsque (X n n est une martingale EI, on a donc X n = E[X F n ] p.s. et pour chaque n : on dit que la martingale (X n n est fermée. En tant que martingale EI, la martingale de Doob est convergente p.s. et dans L 1. On peut préciser la limite : Théorème 2.3 [DOOB] Soit Z une v.a.r. intégrable, (F n n une filtration et F = σ( n F n. Alors, E[Z F n ] p.s.,l 1 E[Z F ]. Pour le critère quadratique, E[Z F n ] est la meilleure approximation de Z sachant F n. On ne peut donc espérer récupérer la totalité de l information que si Z est F -mesurable, car alors E[Z F ] = Z p.s. 1. Benoît Cadre - ENS Cachan Bretagne 2. (Z n n 0 est défini par récurrence par Z 0 = 0 et Z n+1 = Z n i=1 ξ i n+1 1, pour (ξi n i,n 1 i.i.d. intégrables et à valeurs dans N

3. TEMPS D ARRET Pour une filtration (F n n, on notera F = σ( n F n. Définition 3.1 Soit (F n n une filtration. Une v.a. T à valeurs dans N { } est un (F n n -temps d arrêt (t.a. si n, {T = n} F n ou bien, de façon équivalente, si n, {T n} F n. Noter que, alors, {T = } F. Exemples 3.1 Une v.a. entière et p.s. constante est un t.a. pour toute filtration ; INSTANT DE 1ÈRE ENTRÉE DANS UN BORÉLIEN. Soit (X n n un processus (F n n -adapté et B un borélien de R. Avec la convention inf /0 =, la v.a. T = inf{n : X n B} est un (F n n -t.a. Si k N, en adoptant la convention sup /0 = 0, S = sup{n k : X n B} n est en général pas un t.a. Propriétés 3.1 Soient S,T deux (F n n -t.a. Alors S T, S T et S + T sont des (F n n -t.a. Définition-Proposition 3.2 Soit T un (F n n -t.a. On note F T = { A F : A {T = n} F n, n } = { A F : A {T n} F n, n }. La classe d événements F T est une tribu, appelée tribu des événements antérieurs à T. Noter que σ(t F T, l égalité étant fausse en général. Il faut comprendre cette tribu de la manière suivante : si (F n n 0 est la filtration naturelle du processus (X n n 0 et T est un t.a. relatif à cette filtration, l information contenue dans F T comprend, d une part, la valeur de T et d autre part, les valeurs de X 0,,X T. Propriétés 3.2 Soient S,T deux (F n n -t.a. Alors, F S T = F S F T et en particulier, si S T, F S F T. Propriété 3.3 Soit (X n n un processus (F n n -adapté et T un (F n n -t.a. p.s. fini. On note X T l application définie pour chaque ω Ω par X T (ω = X T (ω (ω. Alors X T est une v.a.r. F T -mesurable. Définition 3.3 Soit (X n n un processus (F n n -adapté et T un (F n n -t.a. On appelle processus arrêté à l instant T le processus X T = (X T n n défini pour chaque n par X T n = X n T. Il faut remarquer ici que pour chaque n, X T n est F n T -mesurable et donc F n -mesurable. 4. THEOREMES D ARRET POUR LES MARTINGALES Théorème 4.1 [THÉORÈME D ARRÊT 1] Soit (X n n une (F n n -sous-martingale et S,T deux (F n n -t.a. bornés tels que S T. Alors, X S,X T L 1 et de plus, E[X T F S ] X S p.s. Exercice 4.1 Soit S = (S n n 0, la marche aléatoire simple symétrique issue de 0 et définie sur les entiers relatifs, et T l instant de 1ère entrée dans l état 1. En utilisant le théorème ci-dessus, montrer que T < p.s. Dans cet exemple, on a donc 1 = ES T ES 0 = 0 : ainsi, dans le théorème précédent, l hypothèse de bornitude des t.a. joue un rôle essentiel. Lorsque ce n est pas le cas, il faut pouvoir préciser le comportement asymptotique de la martingale. 2

Pour un processus (X n n qui converge, on note X sa limite et on convient que X T = X sur l événement {T = }. Théorème 4.2 [THÉORÈME D ARRÊT 2] Soit (X n n une (F n n -sous-martingale, et S,T deux (F n n -t.a. (finis ou non tels que S T p.s. Si (X n n est EI, alors X S,X T L 1 et E[X T F S ] X S p.s. Une conséquence de ce théorème est que si (X n n est une (F n n -martingale EI, {X T, T un (F n n -t.a.} est une famille EI. Exercice 4.2 [RUINE DU JOUEUR] Un joueur joue à pile ou face avec une pièce équilibrée. Si il fait "pile" (resp. "face", il gagne 1$ (resp. perd 1$. Il s arrête de jouer lorsque son gain vaut 0 ou m 1. Sa fortune avant de commencer le jeu est 0 k m. Montrer que le jeu finira par s arrêter, et calculer la loi du gain lorsque la partie est terminée. 5. DECOMPOSITION DE DOOB Définition 5.1 Soit (X n n 0 un processus stochastique et (F n n 0 une filtration. On dit que (X n n 0 est (F n n 0 -prévisible si, pour tout n 0, X n est F n 1 -mesurable (avec la convention F 1 = {/0,Ω}. En clair, le processus (X n n 0 est (F n n 0 -prévisible si, à l instant n, l information disponible F n permet de connaître la valeur prise par X n+1 : on peut donc "prédire" la valeur future. Théorème 5.1 [DÉCOMPOSITION DE DOOB] Soit (X n n 0 une (F n n 0 -sous-martingale. Il existe une décomposition unique de (X n n 0 sous la forme X n = X 0 + M n + A n p.s. pour tout n, avec : (M n n 0 une (F n n 0 -martingale telle que M 0 = 0 p.s. ; (A n n 0 est prévisible, croissant, et A 0 = 0 p.s.. Remarque 5.1 Le processus (A n n se calcule par récurrence, en utilisant la relation A n+1 A n = E[X n+1 F n ] X n. Le théorème 5.1 est souvent utilisé sous la forme suivante : si Y = (Y n n 0 est une martingale de carré intégrable, (Y 2 n n 0 est une sous-martingale. Le processus prévisible et croissant (A n n 0 intervenant dans la décomposition de Doob de (Y 2 n n 0 est appelé crochet de la martingale Y, et est noté Y n. En particulier, si Y 0 = 0, on a la relation EY 2 T = E Y T, pour tout t.a. borné T. Exercice 5.1 Soient ξ 1,ξ 2, des v.a.r.i.i.d. dont la loi est de carré intégrable, et M = (M n n 0 le processus défini par M 0 = 0 et M n = ξ 1 + + ξ n pour n 1. a. Montrer que si ξ est centrée, alors M n = neξ 2. b. Dans le contexte de l exercice 4.1, en déduire que T / L 1. c. Soit S un t.a. pour M, avec ES <. Montrer l identité de Wald : EM S = ESEξ. Exercice 5.2 Deux joueurs, André et Berthe, jouent simultanément à pile ou face, chacun avec sa propre pièce, qui est équilibrée. Les joueurs lancent la pièce, jusqu à ce que l un d entre eux ait fait r piles de plus que son adversaire. Il est alors déclaré vainqueur de la partie. Montrer que le nombre de jeux d une partie est fini, et même intégrable. Calculer le nombre moyen de jeux. A titre de complément, et pour bien voir à quel point la convergence des martingales de carrés intégrables est liée à celle de leur crochet : 3

Théorème 5.2 [LFGN POUR LES MARTINGALES] Soit X = (X n n 0 une martingale de carré intégrable. (i Pour P-p.t. ω { X < }, la suite (X n (ω n 0 converge. (ii Soit f : R + R + croissante telle que 0 (1 + f (x 2 dx <. Pour P-p.t. ω { X = } : X n (ω f ( X n (ω 0. 6. APPLICATION : UNE STRATEGIE DE DECISION Une usine produit des composants électroniques qui peuvent sortir défectueux de la chaîne de fabrication. Le nombre de pièces fabriquées étant gigantesque et l examen de chaque pièce étant relativement coûteux, il est impensable d évaluer la qualité de toute sa production. Dans la suite, p 0 désigne la probabilité, inconnue, qu une pièce soit défectueuse. Un acheteur cherchera à n accepter un stock de pièces tel que p 0 p a qu avec une probabilité β et l industriel cherchera à ne rejeter un stock tel que p 0 p i (avec 0 < p i < p a < 1 qu avec une probabilité α (α,β ]0,1[. Comment répondre à ces deux exigences? Il s agit donc de construire une stratégie de décision respectant les consignes ci-dessus. Dans la suite, x k = 1 si le k-ième composant électronique est défectueux, et 0 sinon. Puis, z k = x k ln p a p i + (1 x k ln 1 p a 1 p i. Le test séquentiel du rapport de vraisemblance est la stratégie de décision suivante : On examine successivement des pièces du stock. Après l examen de la n- ième pièce, trois décisions doivent être envisagées : examiner la (n + 1-ème pièce, si z 1 + + z n ]lnβ,ln(1/α[; rejeter le stock, si z 1 + + z n ln(1/α ; accepter le stock, si z 1 + + z n lnβ. Vérifions maintenant que cette stratégie répond aux exigences. Pour p ]0,1[, soit P p la probabilité sur {0,1} N dont la restriction à {0,1} n vaut B(p n pour tout n 1. On considère l échantillon canonique (X 1,X 2, sur ({0,1} N,P p. Par analogie au cas où le nombre d observations est fixé, on défini la vraisemblance du sous-échantillon (X 1,,X n de loi B(p n par L n (p = L n (X 1,,X n ; p = p n i=1 X i (1 p n n i=1 X i. En notant pour chaque k 1 : on a alors Z k = X k ln p a p i + (1 X k ln 1 p a 1 p i, S n = ln L n(p a L n (p i = Z 1 + + Z n. La stratégie de décision consiste à arrêter l examen des pièces à partir de la ν-ème, où { ν = inf n 1 : L n (p a L n (p i 1 α ou L n(p a } L n (p i β = inf {n 1 : S n / ]lnβ,ln 1 } α [. 4

Soit E p l espérance sous la loi P p. Posons m p = EZ 1 et S 0 = 0. Comme (S n ν n ν m p n 0 est une P p - martingale et S n ν max( lnα, lnβ, on déduit que ν L 1 (P p si m p 0 (le cas m p = 0 est traité par un argument similaire. En particulier, ν est P p -p.s. fini pour tout p ]0,1[, donc l algorithme de décision a une fin. De plus, la vraisemblance L ν (p de l observation (X 1,,X ν a un sens. Pour toute fonction à valeurs positives φ, on a ( Lν (p a E pa φ(x 1,,X ν = E pi L ν (p i φ(x 1,,X ν. Par suite, ( P pa Sν lnβ ( Lν (p a = E pi L ν (p i 1 ( { L ν (pa Lν (p i β} β et P pi Sν ln(1/α ( Lν (p i = E pa L ν (p a 1 { L ν (p i α. Lν (pa α} Par ailleurs, on vérifie que : ( P p0 Sν ln(1/α ( P pi Sν ln(1/α α si p 0 p ( i et P p0 Sν lnβ ( P pa Sν lnβ β si p 0 p a. En conclusion, la stratégie de décision rempli les conditions imposées : si p 0 p i, la probabilité de rejeter le stock en adoptant cette stratégie est α et, si p 0 p a, la probabilité d accepter le stock avec cette stratégie est β. REFERENCES P. Billingsley, Probability and Measure, 3rd Edition, Wiley, 1995. D. Dacunha-Castelle et M. Duflo, Probabilités et statistiques - Tome 2 : Problèmes à temps mobile (Cours et Exercices, Masson, 1983. R. Durrett, Probability : Theory and Examples, 4th Edition, Cambridge University Press, 2010. D. Foata et A. Fuchs, Processus stochastiques - Processus de Poisson, chaînes de Markov et martingales, Dunod, 2002. J. Neveu, Martingales à temps discret, Masson, 1972. J.-Y. Ouvrard, Probabilités 2 : maîtrise agrégation, Cassini, 2001. D. Williams, Probability with martingales, Cambridge University Press, 1991. 5