TD 11 : Convergence de chaînes de Markov Corrigé

Documents pareils
Chapitre 3. Mesures stationnaires. et théorèmes de convergence

Texte Agrégation limitée par diffusion interne

aux différences est appelé équation aux différences d ordre n en forme normale.

Comparaison de fonctions Développements limités. Chapitre 10

Espérance conditionnelle

Capacité d un canal Second Théorème de Shannon. Théorie de l information 1/34

Master IMEA 1 Calcul Stochastique et Finance Feuille de T.D. n o 1

Probabilités et Statistiques. Feuille 2 : variables aléatoires discrètes

4. Martingales à temps discret

* très facile ** facile *** difficulté moyenne **** difficile ***** très difficile I : Incontournable T : pour travailler et mémoriser le cours

Travaux dirigés d introduction aux Probabilités

Moments des variables aléatoires réelles

Probabilités conditionnelles Exercices corrigés

Probabilités III Introduction à l évaluation d options

Continuité en un point

3. Conditionnement P (B)

TSTI 2D CH X : Exemples de lois à densité 1

Coefficients binomiaux

Modèles à Événements Discrets. Réseaux de Petri Stochastiques

Chapitre VI - Méthodes de factorisation

Chapitre 2 Le problème de l unicité des solutions

Simulation de variables aléatoires

Dualité dans les espaces de Lebesgue et mesures de Radon finies

Exercice autour de densité, fonction de répatition, espérance et variance de variables quelconques.

PRIME D UNE OPTION D ACHAT OU DE VENTE

Exercices - Polynômes : corrigé. Opérations sur les polynômes

Loi d une variable discrète

Théorie de la Mesure et Intégration

Amphi 3: Espaces complets - Applications linéaires continues

Programmes des classes préparatoires aux Grandes Ecoles

Séminaire TEST. 1 Présentation du sujet. October 18th, 2013

Suites numériques 4. 1 Autres recettes pour calculer les limites

Intégration et probabilités TD1 Espaces mesurés Corrigé

Module 7: Chaînes de Markov à temps continu

Chaînes de Markov au lycée

Intégration et probabilités ENS Paris, TD (20)13 Lois des grands nombres, théorème central limite. Corrigé :

CCP PSI Mathématiques 1 : un corrigé

GEA II Introduction aux probabilités Poly. de révision. Lionel Darondeau

Baccalauréat ES Polynésie (spécialité) 10 septembre 2014 Corrigé

Calcul fonctionnel holomorphe dans les algèbres de Banach

Limites finies en un point

3 Approximation de solutions d équations

Probabilités sur un univers fini

avec des nombres entiers

MODELES DE DUREE DE VIE

ENS de Lyon TD septembre 2012 Introduction aux probabilités. A partie finie de N

Intégration et probabilités TD1 Espaces mesurés

Chapitre 2. Eléments pour comprendre un énoncé

Licence MASS (Re-)Mise à niveau en Probabilités. Feuilles de 1 à 7

Exercices sur le chapitre «Probabilités»

Calcul matriciel. Définition 1 Une matrice de format (m,n) est un tableau rectangulaire de mn éléments, rangés en m lignes et n colonnes.

Chapitre 3. Quelques fonctions usuelles. 1 Fonctions logarithme et exponentielle. 1.1 La fonction logarithme

Image d un intervalle par une fonction continue

EXERCICE 4 (7 points ) (Commun à tous les candidats)

Correction du baccalauréat STMG Polynésie 17 juin 2014

F411 - Courbes Paramétrées, Polaires

Tests non-paramétriques de non-effet et d adéquation pour des covariables fonctionnelles

CALCUL DES PROBABILITES

Souad EL Bernoussi. Groupe d Analyse Numérique et Optimisation Rabat http ://

Correction de l examen de la première session

HERAKLES Page 1 sur 6 COMMENT CREER DES FACTURES D ACCOMPTE FICHE COMMENT CREER DES FACTURES D ACCOMPTE?

Correction du Baccalauréat S Amérique du Nord mai 2007

Théorie de la Mesure et Intégration

Contexte. Pour cela, elles doivent être très compliquées, c est-à-dire elles doivent être très différentes des fonctions simples,

Correction du baccalauréat ES/L Métropole 20 juin 2014

Mesures et Intégration

Un modèle stochastique du taux d intérêt implicite en microcrédit

Introduction au Calcul des Probabilités

Contents. 1 Introduction Objectifs des systèmes bonus-malus Système bonus-malus à classes Système bonus-malus : Principes

Lagrange, où λ 1 est pour la contrainte sur µ p ).

I3, Probabilités 2014 Travaux Dirigés F BM F BM F BM F BM F B M F B M F B M F B M

P1 : Corrigés des exercices

Fiche PanaMaths Calculs avec les fonctions sous Xcas

O, i, ) ln x. (ln x)2

ÉTUDE ASYMPTOTIQUE D UNE MARCHE ALÉATOIRE CENTRIFUGE

Actuariat I ACT2121. septième séance. Arthur Charpentier. Automne charpentier.arthur@uqam.ca. http ://freakonometrics.blog.free.

Exo7. Limites de fonctions. 1 Théorie. 2 Calculs

Sub CalculAnnuite() Const TITRE As String = "Calcul d'annuité de remboursement d'un emprunt"

Calculs de probabilités conditionelles

Extrait du poly de Stage de Grésillon 1, août 2010

Logique. Plan du chapitre

Optimisation des fonctions de plusieurs variables

DÉRIVÉES. I Nombre dérivé - Tangente. Exercice 01 (voir réponses et correction) ( voir animation )

Modèle de troncature gauche : Comparaison par simulation sur données indépendantes et dépendantes

Probabilités. Une urne contient 3 billes vertes et 5 billes rouges toutes indiscernables au toucher.

Espaces probabilisés

Continuité et dérivabilité d une fonction

La classification automatique de données quantitatives

Leçon 01 Exercices d'entraînement

ACTUARIAT 1, ACT 2121, AUTOMNE 2013 #16

Chapitre 2. Matrices

I. Polynômes de Tchebychev

CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures)

Résolution d équations non linéaires

Proposition. Si G est un groupe simple d ordre 60 alors G est isomorphe à A 5.

Analyse stochastique de la CRM à ordre partiel dans le cadre des essais cliniques de phase I

Processus Stochastiques

Baccalauréat ES Amérique du Nord 4 juin 2008

Baccalauréat ES/L Métropole La Réunion 13 septembre 2013 Corrigé

I. Introduction. 1. Objectifs. 2. Les options. a. Présentation du problème.

Transcription:

Processus aléatoires ENS Paris, 206-207 Thomas Budzinski Bureau V2 thomas.budzinski@ens.fr TD : Convergence de chaînes de Markov Corrigé Lundi 2 Décembre Exercice (Les parapluies) Michel possède k parapluies qu il garde soit chez lui, soit dans son bureau à Ulm. Le matin, avant d aller au travail, il regarde par la fenêtre le temps qu il fait : s il fait beau, il ne prend pas de parapluie. s il pleut et qu il a un parapluie chez lui, il prend le parapluie et va au travail. s il pleut et qu il n y a plus de parapluie, il décide de rester chez lui. Le soir, il fait la même chose (s il pleut et qu il n a pas de parapluies, il décide de rentrer quand même). On suppose que chaque demi-journée, il pleut avec probabilité p et il fait beau avec probabilité p avec 0 < p <, et que de plus, les météos des demi-journées sont indépendantes. Michel souhaite ne rater en moyenne qu une journée de travail par semaine. Combien de parapluies doit-il posséder pour cela? Solution de l exercice Notons X n le nombre de parapluies que Michel a chez lui le soir du n-ième jour. Chaque jour : avec proba p( p), il pleut le matin mais pas l après-midi, auquel cas X n diminue de (sauf si X n = 0), avec proba p( p), il pleut l après-midi mais pas le matin, auquel cas X n augmente de (sauf si X n = k), avec proba p 2 + ( p) 2, il pleut toute la journée ou pas du tout, auquel cas X n ne change pas (y compris si X n = 0 ou k). On en déduit que X est une chaîne de Markov sur {0,,..., k} de matrice de transition Q avec p( p) si i j =, p 2 + ( p) 2 si i = j / {0, k}, Q(i, j) = p( p) si i = j {0, k}, 0 si i j 2. Cette chaîne de Markov est irréductible car Q i j (i, j) > 0 pour tous i, j et apériodique car Q(0, 0) > 0. Elle admet donc une unique mesure de probabilité stationnaire et converge vers cette mesure stationnaire. On cherche une mesure µ réversible pour Q, i.e. telle que pour tous i et j, µ(i)q(i, j) = µ(j)q(j, i). () La condition est trivialement vérifiée pour i = j (par symétrie) et pour i j 2 (les deux membres sont nuls), donc il suffit d avoir µ(i)q(i, i + ) = µ(i + )Q(i +, i) pour tout 0 i k, soit p( p)µ(i) = p( p)µ(i+), soit µ(i+) = µ(i). Ainsi, la mesure uniforme µ sur {0,,..., k} est réversible, donc stationnaire, pour Q, donc P (X n = 0) µ(0) = k +,

et P (Michel reste chez lui le jour n) = P (X n = 0 et il pleut le n-ième matin) = p P(X n = 0) p k +. Or, il pleut en moyenne jours par an à Paris. On a donc ( p) 2 = 365, soit p 0, 658. Pour p ne rater qu un jour de travail par semaine en moyenne, il faut donc k+ 7, donc Michel doit avoir au moins 7p, 6 parapluies, donc au moins 2. Pour rater en moyenne moins d un jour par mois, il doit en avoir 5. Exercice 2 (Rangement sur une étagère) Chaque matin un étudiant prend un des trois livres (numérotés de à 3) posés sur son étagère. La probabilité qu il choisisse le livre i est α i, pour i {, 2, 3}, où 0 < α i < et α + α 2 + α 3 =, et les choix qu il fait jour après jour sont indépendants. Le soir, il replace le livre qu il a pris à gauche des autres, sans les déranger. Quel est le comportement asymptotique de p n, la probabilité que le n-ième matin au réveil l étudiant trouve ses livres rangés dans l ordre (, 2, 3) de gauche à droite? Solution de l exercice 2 Pour tout n 0, on note X n l ordre des livres au n-ième matin, avant que l étudiant ne fasse son choix. La variable X n est à valeurs dans l espace des permutations S = {(, 2, 3), (, 3, 2), (2,, 3), (2, 3, ), (3,, 2), (3, 2, )}. On note ξ n le numéro du livre choisi par l étudiant le n-ième matin. Les (ξ n ) n 0 sont des variables aléatoires i.i.d. à valeurs dans {, 2, 3}, on note γ la loi de ξ. Pour tout n, la variable X n est σ(ξ 0, ξ n )- mesurable, donc ξ n est indépendante de X n. On en déduit que (X n ) n 0 est une chaîne de Markov à valeurs dans S de matrice de transition Q avec, pour toute permutation (a, b, c) de (, 2, 3), Q((a, b, c), (a, b, c)) = α a, Q((a, b, c), (b, a, c)) = α b, Q((a, b, c), (c, a, b)) = α c, Q((a, b, c), (d, e, f)) = 0 dans les autres cas. Cette chaîne est irréductible et apériodique. Elle possède donc une unique mesure de probabilité invariante, que l on note π. De plus, pour tout x S, on a lim P(X n = x) = π(x). On détermine maintenant π. Soit (a, b, c) S. Comme πq = π, on a π(a, b, c) = α a [π(a, b, c) + π(b, a, c) + π(b, c, a)]. En particulier, on a π(a, b, c) + π(a, c, b) = α a x S π(x) = α a. Par symétrie, on a donc aussi π(b, a, c) + π(b, c, a) = α b. On en déduit π(a, b, c) = α a (π(a, b, c) + π(b, a, c) + π(b, c, a)) = α a (π(a, b, c) + α b ), donc π(a, b, c) = αaα b α a. En particulier lim p n = αα2 α. Exercice 3 (Durée de vie des ampoules) Soit (Y n ) n une suite de variables i.i.d. à valeurs dans N vérifiant : µ = E[Y ] < +, pgcd {n : P(Y = n) > 0} =. On définit le processus (X n ) n 0 par X 0 = 0 et pour tout n, X n = inf{m n k, Y +... + Y k = m} n.. Montrer que (X n ) n N est une chaîne de Markov irréductible, et apériodique. 2. En déduire lim P( k, Y +... + Y k = n) = µ. 2

3. Quel est le rapport avec le titre de l exercice? Solution de l exercice 3. On remarque (faire un dessin!) que, pour tout n 0, X n+ = { Xn si X n 0, Y k+ si X n = 0 et n = Y +... + Y k. Sur l événement {Y +... + Y k = n} (qui est évidemment dans σ(y,..., Y k )), les variables X 0,..., X n sont σ(y,..., Y k )-mesurables, et donc indépendantes de X n+ = Y k+. Sur l événement {X n }, X n+ = X n p.s. Cela implique que (X n ) n 0 est une chaîne de Markov de matrice de transition Q définie par Q(i, i ) = pour i Q(0, j) = P(Y = j + ) pour j 0 Q(i, j) = 0 dans les autres cas. En effet, on a pour tous (x 0,..., x n+ ) N, si x n > 0 : P (X 0 = x 0,..., X n+ = x n+ ) = { 0 si xn+ x n, P (X 0 = x 0,..., X n = x n ) sinon. Si x n = 0, d après l indépendance énoncée ci-dessus, P (X 0 = x 0,..., X n+ = x n+ ) = k P (X 0 = x 0,..., X n = 0, Y +... + Y k = n, X n+ = x n+ ) = k P (X 0 = x 0,..., X n = 0, Y +... + Y k = n, Y k+ = x n+ + ) = k P (X 0 = x 0,..., X n = 0, Y +... + Y k = n) P (Y k+ = x n+ + ) = P (X 0 = x 0,..., X n = 0, Y +... + Y k = n) k P (Y = x n+ + ) = P (X 0 = x 0,..., X n = 0) P (Y = x n+ ). L espace d états de (X n ) n 0 est S = {0,..., m} si m = sup{i 0 P(Y = i+) > 0} < + et S = N sinon. On vérifie que (X n ) n 0 est irréductible. Soient i, j S. Si i > j, alors Q i j (i, j) = > 0. Si i j, soit l j tel que P(Y = l + ) > 0. Alors Enfin, pour tout n, donc Q i+l j+ (i, j) Q i (i, 0)Q(0, l)q l j (l, j) > 0. Q n (0, 0) P(Y = n), L 0 := {n Q n (0, 0) > 0} {n P(Y = n) > 0}, où ce dernier ensemble est de PGCD, donc 0 est de période, donc la chaîne est apériodique. 2. D après la question précédente Q admet une unique mesure stationnaire ν et X converge en loi vers ν. La limite qui nous intéresse est donc lim P (X n = 0) = ν(0). 3

On a donc calculer ν. Pour tout i, on a ν(i) = ν(i + ) + ν(0)p (Y = i + ), d où on déduit facilement par récurrence ν(i) = ν(0)p (Y > i). On a donc = ν(0) i 0 P (Y > i) = ν(0) i P (Y i) = ν(0)µ, donc ν(0) = µ, d où le résultat. 3. Imaginons que la suite (Y n ) n représente la durée de vie d ampoules. Quand la k-ième ampoule ne fonctionne plus, on la remplace par la (k + )-ième dont la durée de vie est Y k+. L exercice montre qu asymptotiquement, la probabilité d avoir à changer une ampoule à l instant n est l inverse de la durée de vie moyenne des ampoules. Exercice 4 (Un mélange de cartes) Soit n > 0. On cherche à mélanger un jeu de n cartes numérotées de à n. À l instant 0, les cartes sont rangées dans l ordre (la carte est en haut du paquet, la carte n en bas). À chaque instant, on choisit uniformément une carte dans le paquet et on la replace en haut. À l instant k, le paquet est décrit par une permutation σ de {, 2,..., n} qu on note X k (plus précisément X k (i) est le numéro sur la i-ème carte du paquet en partant du haut). On note µ k la loi de X k et µ la mesure uniforme sur S n. Le but de l exercice est d estimer combien de fois il faut répéter cette opération pour que le jeu soit bien mélangé. Si µ et ν sont deux mesures sur S n, on notera la distance en variation totale entre µ et ν. d(µ, ν) = max A S n µ(a) ν(a). Montrer que d(µ, µ k ) 0 quand k + à n fixé. 2. On note A k l ensemble des cartes qui ont été déplacées au moins une fois en haut du paquet entre l instant 0 et l instant k, et T i = min { k 0 Ak i }. Montrer que pour tous ε > 0 et j > 0 fixés, on a P ( ( ε)n ln n T n j ( + ε)n ln n ). 3. En déduire que si k = ( ε)n ln n, alors d(µ k, µ). 4. On place à côté de notre jeu un deuxième jeu, déjà mélangé de manière uniforme. À chaque instant k, si on place la carte numérotée i en haut du premier paquet, on place également la carte numérotée i en haut du second paquet. On note X k la permutation qui décrit le second jeu au temps k. Montrer que X k est uniforme pour tout k et que, pour k = ( + ε)n ln n, 5. En déduire que si k = ( + ε)n ln n, alors P (X k = X ) k. d(µ k, µ) 0. Solution de l exercice 4 Dans tout ce qui suit, la dépendance en n sera implicite. 4

. On voit que X est une chaîne de Markov de matrice de transition Q avec { Q(σ, π) = n si π = c σ où c est un cycle de la forme ( 2 i), 0 sinon. Ainsi, pour toute permutation π, il existe exactement n permutations σ telles que Q(σ, π) = n et on a Q(σ, π) = 0 pour toutes les autres. On en déduit n! = Q(σ, π), n! σ S n donc la mesure uniforme µ est stationnaire pour Q. Pour assurer la convergence de X vers µ, il suffit donc de montrer que Q est irréductible et apériodique. L apériodicité est évidente car Q(σ, σ) = n > 0 pour tout σ. De plus, en partant de σ on peut toujours obtenir la permutation π en plaçant successivement en haut du paquet les cartes π(n), π(n ),..., π(), donc Q est irréductible. 2. Si A k = i, alors conditionnellement à F k, la probabilité de placer une "nouvelle" carte en haut du paquet vaut n i n. En utilisant la propriété de Markov forte, on en déduit que les T i+ T i sont indépendantes, avec T i+ T i géométrique de paramètre n i n. On a donc et, par indépendance, Var(T n j ) = E[T n j ] = E [T i+ T i ] = n Var (T i+ T i ) = = n ln n + O(n) n i ni (n i) 2 n2 (n i) 2 π2 6 n2. Comme Var(T n j ) = o ( E[T n j ] 2) quand n +, on en déduit le résultat par Bienaymé- Chebychev. 3. Soit j > 0, et S j l ensemble des permutations σ telles que π(n) > π(n ) > > π(n j + ). On a d une part µ(s j ) = j!. D autre part, avec proba tendant vers quand n + on a T n j ( ε)n ln n d après la question précédente. Or, on remarque que les cartes qui n ont jamais été "remontées" se trouvent en-dessous de toutes les autres. Par conséquent, si T n j k, alors au temps k les j cartes les plus basses du paquet n ont jamais été remontées, donc les j cartes les plus basses du paquet sont encore dans l ordre croissant, donc X k S j. On a donc µ k (S j ) pour j fixé et k = ( ε)n ln n. On a donc µ(s j ) µ k (S j ) 2 j! pour n assez grand, donc d(µ k, µ) 2 j!. Comme cela est vrai pour tout j, on en déduit le résultat. 4. À chaque instant, la carte qu on remonte en haut du premier jeu est uniforme, donc son numéro est uniforme dans {,..., n}, donc la carte qu on remonte en haut du second jeu est uniforme, donc X est une chaîne de Markov avec les mêmes transitions que X. Elle admet donc la mesure uniforme comme mesure stationnaire. Comme X 0 est déjà uniforme, la permutation X k est donc uniforme pour tout k. Par ailleurs, considérons deux cartes i et j. Une fois que i et j ont toutes les deux été remontées au moins une fois, leur position relative est la même dans les deux paquets (la plus haute est la dernière à avoir été remontée). Par conséquent, dès que toutes les cartes ont été remontées au moins une fois, les positions relatives de i et j sont les mêmes dans les deux paquets pour tous i et j, donc les deux paquets sont rangés identiquement. Par conséquent, on a X k = X k dès que k T n. On conclut en utilisant la question 2. 5

5. Pour tout A S n, on a, en utilisant le fait que X k est uniforme, ( µ k (A) µ(a) = P (X k A) P Xk A) ( P X k A, X ) ( k / A + P X k / A, X ) k A 2 P (X k X ) k 0. Remarque Cet exercice est un problème de temps de mélange. Un phénomène un peu surprenant se produit ici : alors qu on pourrait s attendre à ce que le jeu se mélange "progressivement", il est en fait très mal mélangé après un temps 0.99 n ln n et très bien mélangé après un temps.0 n ln n. Ce phénomène, assez courant dans les problèmes de mélanges de cartes, est appelé "cutoff". 6