1. Différents types de Convergence des suites de v.a.

1. Différents types de Convergence des suites de v.a. 1.1. Convergence "spatiales". Les convergence dites "spatiales" font référence à la réalisation des v.a. sur un même espace de probabilité et pas seulement à leur lois comme la convergence en loi (que l'on rappellera dans la suite). Denition 1.1. (Convergences spatiales) Soit (X n ) n N une suite de v.a. à valeurs dans R d (ou plus généralement dans un espace métrique), et X une v.a. à valeurs dans R d. Toutes ces v.a. sont dénies sur un même espace de probabilité (Ω, F, ). i) On dit que la suite (X n ) converge presque sûrement vers la v.a. X si il existe un événement N de mesure nulle tel que X n(w) = X(w), ω N c. On note souvent X n ii) On dit que (X n ) converge en probabilité vers la v.a. X si pour tout ɛ > 0 On note souvent X n ( X n X > ɛ) = 0. iii) Soit p 1. Supposons que les v.a. (X n ) et X sont dans L p. On dit que X n converge dans L p vers la v.a. X si On note souvent X n L p E( X n X p ) = 0. roposition 1.1. i) La convergence et la convergence dans L p, p 1, entraînent la convergence en probabilité. ii) La convergence en probabilité entraîne la convergence d'une sous-suite. C'est-à-dire que si X n X alors il existe une sous-suite φ(n) telle que X φ(n) roof. cf cours de L3 Exemple: Soient (X n ) une suite de v.a. indépendantes telles que X n suit une loi de Bernoulli de paramètre p n [0, 1]. On a alors X n X n 0, ssi p n = 0, 0, ssi pn <. (En particulier, on voit sur cet exemple que la convergence en probabilité n'implique pas la convergence ) En eet, pour tout 0 < ɛ < 1, ( X n > ɛ) = p n. On voit donc que la première propriété vient de la dénition de la convergence en probabilité. La deuxième vient de Borel-Cantelli. En eet, comme X n (ω) ne peut prendre que deux valeurs, X n (ω) converge vers 0 si et seulement si elle est stationnaire à 0. On a donc {ω, X n (ω) 0} = {ω, X n (ω) = 0 à partir d'un certain rang} = n m n {ω, X m (w) = 0} = inf A n, où A n = {X n = 0} qui est de probabilité 1 p n. En utilisant les deux énoncés du lemme de Borel-Cantelli, on obtient le deuxième résultat. 1

2 1.2. Convergence en loi. 1.2.1. Dénition. Denition 1.2. (Convergence en loi) i) (Convergence étroite des mesures.) Soit (µ n ) une suite de mesures de probabilité sur R d et µ une mesure sur R d. On dit que la suite (µ n ) converge étroitement vers la mesure de probabilité µ si pour toute fonction continue bornée f : R d R On note souvent µ n µ. R d fdµ n = R d fdµ. ii) On dit qu'une suite de v.a. (X n ) n 1 à valeurs dans R d converge en loi vers une v.a. X si les lois µ Xn convergent étroitement vers µ X, la loi de X. Autrement dit, si On le note X n loi E(f(X n)) = E(f(X)), f C 0 b (R d, R). N.B. : on note C 0 b (Rd, R) l'ensemble des fonctions continues bornées de R d dans R. Remarque : On voit que la convergence en loi ne fait référence qu'à la loi des v.a. (contrairement aux convergences, en proba, et L p ). On peut très bien dénir la convergence en loi d'une suite de v.a. qui ne seraient pas dénies sur le même espace de probabilité. roposition 1.2. La convergence en probabilité implique la convergence en loi. Remarque: La convergence en loi est donc la plus faible des convergences qu'on a vues, elle est impliquée par toutes les autres, la convergence, L p et en probabilité. Remarque: Si (X n ) est une suite de v.a. à valeurs dans Z (ou dans un autre sousensemble dénombrable de R d ) alors elle converge en loi vers une v.a. X à valeur dans Z si et seulement si (X n = m) = (X = m), m Z. Remarque: La convergence en loi n'assure pas forcément que pour tout Borélien B (X n B) converge vers (X B). En eet, 1 B n'étant pas une fonction continue, la dénition ne s'applique pas. On peut facilement écrire un contre-exemple: soit a n R, a n > a et a n a. On prend B = (, a]. Si X n = a n et X = a sont des loi v.a. déterministes on a facilement que X n X, mais (X n B) = 0 alors que (X B) = 1. roof. Supposons que (X n ) converge en probabilité vers une v.a. X mais pas en loi. Il existe donc une fonction f C 0 b (Rd, R) telle que E(f(X n )) ne converge pas vers E(f(X)). Donc il existe ɛ > 0 et une sous-suite n k telle que E(f(X nk )) E(f(X)) > ɛ, k 1. Mais la suite X nk converge en proba vers X. On peut donc extraire une sous-suite n kj telle que X nkj converge vers X. ar convergence dominée on a donc ce qui amène à une contradiction. E(f(X n kj )) = E(f(X)), j

Quelques exemples et contre-exemples. i) Soit (X n ) une suite de v.a. telles que X n est de loi uniforme sur l'ensemble {0, 1 n, 2 n,, 1}. La suite (X n) converge en loi vers la mesure uniforme sur l'interval [0, 1] (par application des sommes de Riemann). ii) La convergence en loi n'implique pas la convergence en probabilité, même si les v.a. sont dénies sur le même espace de probabilité: c'est illustré par le contre-exemple suivant. Soit (Ω, F, ) = ([0, 1], B([0, 1]), λ [0,1] ), et X n (ω) = 0, si n est pair et si ω < 1 2 1, si n est impair et si ω < 1 2 0, si n est pair et si ω 1 2 1, si n est impair et si ω 1 2 La loi de X n est toujours la même 1 2 δ 0 + 1 2 δ 1. Donc, X n converge en loi vers X 1, mais pas en probabilité puisque ( X n X 1 = 1) = 1 quand n est pair. 1.2.2. Une dénition alternative de la convergence en loi pour d = 1. roposition 1.3. Une suite de v.a. réelles (X n ) converge en loi vers une v.a. réelle X si et seulement si F X n (t) = F X (t), en tout point t R où la fonction de répartition F X est continue. Remarque: Cette propriété est souvent prise comme dénition de la convergence en loi dans le cas de v.a. réelles. Remarque : La fonction de répartition F X est continue en les points t qui ne sont pas chargés par la loi de X, c'est-à-dire en les points t tels que (X = t) = 0. 3 roof. Supposons que X n converge en loi vers X. Soit ɛ > 0. On considère la fonction φ t,ɛ Cb 0 (R, R) donnée par 1, si u t, φ t,ɛ (u) = 0, si u t + ɛ 1 (u t)/ɛ, si t < u < t + ɛ. (φ t,u est donc la fonction qui s'annule après t + ɛ, qui vaut 1 avant t et qui interpole linéairement entre ces deux valeurs (faire un dessin!)). Comme φ t,ɛ est continue, on a pour tout t R, ɛ > 0 E(φ t,ɛ(x n )) = E(φ t,ɛ (X)). D'autre part, comme 1 (,t] φ t,ɛ 1 (,t+ɛ], on a pour tout n et D'où F Xn (t) E(φ t,ɛ (X n )), E(φ t,ɛ (X)) F X (t + ɛ). sup F Xn (t) F X (t). En utilisant la fonction φ t,ɛ dénie par 1, si u t ɛ, φ t,ɛ(u) = 0, si u t 1 (u t + ɛ)/ɛ, si t ɛ < u < t.,

4 on démontre de la même façon, puisque 1 (,t ɛ] φ t,ɛ 1 (,t] que inf F Xn (t) F X (t ɛ). En faisant tendre ɛ vers 0, on obtient bien que F Xn (t) = F X (t) pour tous les t en lesquels F X est continue. Réciproque. La réciproque passe par un petit lemme. Lemma 1.1. Soit (µ n ) et (µ) des mesures de probabilité. Si pour toute fonction f continue à support compact fdµ n = fdµ R R alors (µ n ) converge étroitement vers la mesure µ. Remarque : La condition importante ici est que la mesure µ est une mesure de probabilité. La notion de convergence qui apparaît dans cet énoncé est la convergence vague (avec des fonctions tests continues à support compact). Ce résultat dit donc que si une suite de mesures de proba converge vaguement vers une mesure de probabilité alors elle converge étroitement. Remarque Considérons la suite de mesures µ n = aδ n + aδ n + (1 2a)δ 0, avec 0 < a < 1 2. On voit que pour tout fonction f C0 c (R, R) on a fdµ n = fdµ avec µ = δ 0. Mais µ n ne converge pas étroitement vers µ (on le voit si par ex. on prend f = 1). Une partie de la masse (celle en n et en n s'est "échappé" vers l'inni et a disparu dans la ite µ). On voit que la convergence étroite interdit cette perte de masse. roof. On peut approcher la fonction constante 1 par une suite de fonctions f k Cc 0 (R) telles que 0 f k 1 et telle que f k (x) = 1 en tout x. Soit φ Cb 0 (R). On a par hypothèse puisque φf k Cc 0 (R) φf k dµ n = φf k dµ, pour tout k. On a donc sup φdµ n φdµ = sup φf k dµ n φf k dµ + φ(1 f k )(dµ n dµ) ( ) 0 + φ (1 f k )dµ + sup (1 f k )dµ n 2 φ (1 f k )dµ. La dernière relation vient du fait que sup (1 f k )dµ n = 1 sup f k dµ n = 1 f k dµ = (1 f k )dµ. où on a utilisé que µ n et µ sont des mesures de proba et que f k est continue à support compact. (Fin de la preuve de la proposition.) On suppose que les fonctions de répartition F Xn convergent vers F X en tout point de continuité de F X. ar lemme précédent il sut de vérier que E(f(X n )) = E(f(X)) pour toute fonction f Cc 0 (R). Soit

f Cc 0 (R). On sait que pour tout ɛ > 0, on peut approcher f par une fonction en escalier f k f = a i 1 ]ti,t i+1 ], i=1 de telle sorte que f f ɛ. On peut toujours choisir les t i de telle sorte que les t i soient des points de continuité de F X (facile...). On a alors E( f(x k n )) = a i (F Xn (t i+1 ) F Xn (t i )). On a donc i=1 fdµ n = fdµ. 5 Mais fdµ n fdµ 2ɛ + fdµ n f dµ. Le dernier terme tend vers 0. On a donc sup fdµ n fdµ 2ɛ, pour tout ɛ > 0. Ceci conclut la preuve de la proposition.