Chapitre 4: Fonctions génératrices (notions) 1 Généralités On considère ici le cas particulier des v.a. à valeurs dans l ensemble N des entiers naturels. Ces v.a. interviennent souvent dans les applications. Il est donc important de disposer d une méthode de portée très générale qui facilite le calcul de leur loi de probabilité et de leurs moments. Une idée qui s est révélée très fructueuse consiste à associer à toute v.a. X à valeurs dans N, une série entière qui contient tous les renseignements concernant la loi de probabilité de X et qui a l avantage d être admirablement bien adaptée à l opération consistant à additionner des v.a. indépendantes. Soit X une v.a. à valeurs dans N, de loi de probabilité donnée par la suite p n P(X n) (n N). Définition 1.1 : On appelle fonction génératrice de X, la série entière (1) G X (t) n0 p n t n (on notera que cette série converge au moins pour t < 1 puisque G X (1) 1 < + ). La fonction génératrice caractérise parfaitement la loi de probabilité d une v.a.. En effet si X et Y sont deux v.a. à valeurs entières telles que G X (t) G Y (t) pour tout t < 1, l unicité du développement d une fonction en série entière montre que X et Y ont la même loi. Théorème 1.2 : Soient G X1,..., G Xn les fonctions génératrices respectives de n v.a. indépendantes X 1,..., X n et à valeurs dans N. La v.a. S X 1 + + X n a une fonction génératrice G S donnée par (2) G S (t) n G Xi (t). i1 Notes du cours de Probabilités de M1 de M. L. Gallardo, Université de Tours, année 2008-2009. Les démonstrations sont détaillées dans le cours oral. 1
démonstration : On suppose n 2 (le cas général se fait ensuite par récurrence sur n). Posons S X 1 + X 2 et G X1 (t) i0 a i t i et G X2 (t) j0 b j t j. Pour calculer c k P(S k) (k N), utilisons le système complet d événements [X 2 j] (j N). Il vient c k j0 P ([X 1 + X 2 k] [X 2 j]) P ([X 1 k j] [X 2 j]) j0 P ([X 1 k j]) P ([X 2 j]) j0 a k j b j. j0 Donc c k est le coefficient du terme en t k dans le développement du produit G X1 (t)g X2 (t). D où le résultat. Exemple 1.3 (et exercices) : 1) si X suit la loi de Bernoulli B(1, p), on a G X (t) 1 p + pt. 2) si X suit la loi binomiale B(n, p), on a G X (t) (1 p + pt) n. 3) Si X suit la loi de Poisson de paramètre λ(> 0), G X (t) e λ(t 1). 4) Si les X i (i 1,..., N) sont des v.a. indépendantes de lois binomiales respectives B(n i, p) de même paramètre p, la v.a. S n i1 X i est de loi binomiale B( N i1 n i, p). 5) Si les X i (i 1,..., N) sont des v.a. indépendantes de lois de Poisson respectives de paramètres λ i, la v.a. S n i1 X i est de loi de Poisson de paramètre λ N i1 λ i. Exercice 1.4 : Une boîte contient quatre boules numérotées 0, 1, 1, 2. On effectue n tirages avec remise. Soit S n la somme des numéros tirés. Déterminer la loi de probabilité de la v.a. S n. Solution : On a G S1 (t) 1 4 + 1 2 t + 1 ( ) 2 1 + t 4 t2. 2 2
Les tirages étant avec remise, S n est la somme de n v.a. indépendantes et de même loi que S 1. D après le théorème, on a donc ( ) 2n 1 + t G Sn (t). 2 En développant avec la formule du binôme de Newton, on déduit immédiatement P(S n k) 1 2 2n Cn k (k 0, 1,..., 2n). Théorème 1.5 : Soit X une v.a. à valeurs entières de fonction génératrice G X. Si X a un moment d ordre 2, les dérivées à gauche G X (1) et G X (1) existent1 en t 1, et on a (3) E(X) G X(1) V ar(x) G X(1) + G X(1) ( G X(1)) 2. Inversement si G X est deux fois dérivable en t 1, X a un moment d ordre 2 et les formules (3) s appliquent 2. démonstration : On peut toujours dériver formellement terme à terme la série entière G X (t), ce qui donne G X(t) n1 np n t n 1 et G X(t) n2 n(n 1)p n t n 2. Si X a un moment d ordre deux, les dérivées à gauche G X (1) et G X (1) sont finies et les formules annoncées pour E(X) et V ar(x) en découlent aussitôt. L autre assertion est facile. Exercice 1.6 : Retrouver l expression de l espérance et de la variance des lois binomiales et de Poisson en utilisant le théorème 1.5. 2 Exemple d application des fonctions génératrices 2.1 Somme d un nombre aléatoire de variables aléatoires Soit X X 1,..., X i,... une suite de v.a. à valeurs entières, indépendantes et de même loi de fonction génératrice G(t) + n0 p nt n. On considérera que l indice i figure le temps et que la suite X décrit l état d un système aléatoire au cours du temps, la v.a. X i mesurant l état du système à l instant i. 1 En effet, les séries G X (t) et G X (t) convergent pour tout t < 1 et les limites lim t 1 G X (t) E(X) et lim t 1 G X (t) E(X(X 1)) existent par le théorème du prolongement d Abel ; on déduit alors du théorème des accroissements finis que ces limites sont les dérivées à gauche G X (1) et G X (1). 2 dans ce cas ce sont des dérivées en t 1. 3
Pour tout entier n N fixé on considère la v.a. S n totalisant les X i jusqu à l instant n : (4) S 0 0 et S n X i si n 1. i1 Dans certains problèmes (nous verrons un exemple ci-dessous) on est amené à considérer une somme d un nombre aléatoire N de termes : S N N i1 X i où N est une v.a. à valeurs entières, définie sur le même espace probabilisé que les X i et indépendante de la suite X 3. La somme S N est définie précisément de la manière suivante : (5) k N, ω [N k], S N (ω) S k (ω). On notera que puisque les événements [N k] (k N) forment un système complet 4, la valeur S N (ω) est bien définie pour tout ω Ω et que les valeurs prises par S N sont entières. Nous admettrons que S N est bien une v.a. 5 Remarque 2.1 : Il est facile de trouver une expression pour la loi de probabilité de la v.a. S N, en notant que grâce à la formule de la probabilité totale, pour tout j N, on a (6) P(S N j) n0 n0 P(S N j N n)p(n n) P(S n j)p(n n), car P(S N j N n) P(S n j N n) P(S n j) d après l hypothèse d indépendance 6. Mais cette expression de la loi de S N n est pas très maniable. Le résultat qui suit donne une expression très simple de la fonction génératrice de S N de laquelle on peut déduire simplement les moments de S N. On note H(t) + n0 q nt n la fonction génératrice de N. Proposition 2.2 : 1) La v.a. S N définie en (5) a une fonction génératrice donnée par la formule (7) G SN (t) H(G(t)) H G(t) 2) si les v.a. X i et N ont un moment d ordre deux, S N a également un moment d ordre deux et on a E(S N ) E(N)E(X 1 ) V ar(s N ) E(N)V ar(x 1 ) + (E(X 1 )) 2 V ar(n). 3 i.e. telle que pour tout entier k, les v.a. N, X 0, X 1,..., X k sont indépendantes. 4 i.e. une partition de Ω. 5 L espace Ω n étant pas discret en général dans les situations de ce type, il conviendrait de vérifier la condition de mesurabilité. 6 en effet on peut montrer facilement que N et S n sont indépendantes. 4
démonstration : Pour n N, par la définition (4) de S n et par le théorème 1.2, on voit que (8) G S0 (t) 1 et G Sn (t) (G(t)) n pour n 1. Pour tout n N, notons p n j P(S n j) le coefficient de t j dans le développement en série entière de G Sn (t). D après la formule (6), P(S N j) + n0 q np n j. On a donc G SN (t) j0 n0 n0 P(S N j)t j q n ( + j0 p n j t j ) j0 n0 n0 q n (G(t)) n H(G(t)). q n p n j t j q n G Sn (t) De plus si les X i et N ont un moment d ordre deux, on peut dériver deux fois les fonctions H et G en t 1 donc la fonction composée H G aussi, ce qui montre que S N a un moment d ordre deux et grâce au théorème 1.5 on obtient alors E(S N ) H (G(1)) G (1) H (1)G (1) E(N)E(X 1 ) V ar(s N ) (H G) (1) + (H G) (1) ((H G) (1)) 2 E(N)V ar(x 1 ) + (E(X 1 )) 2 V ar(n). 2.2 Le processus de Galton-Watson En étudiant le mécanisme de l extinction des noms de famille noble en Grande-Bretagne, Galton et Watson ont été amenés a étudier le processus suivant : On considère des particules pouvant donner naissance à des particules de même nature. Au départ on suppose qu il y a 1 particule (génération zéro). Chaque particule a la même probabilité p k de produire elle même k particules (k N) et on note µ + k0 kp k < + le nombre moyen de descendants d une particule quelconque. Les particules descendantes de la n-ième génération forment la n+1-ième génération. Les particules de chaque génération se comportent indépendamment l une de l autre. Notons X n,k le nombre de particules produites par la particule n o k de la n 1-ième génération. On a donc N 1 X 1,1 N 2 X 2,1 + + X 2,N1. N n X n,1 + + X n,nn 1. etc 5
N n est le nombre de particules composant la n-ième génération 7 On va s intéresser ici au comportement de la suite x n P(N n 0) (probabilité d extinction à la n-ième génération et à sa limite quand n + ( la probabilité d extinction du nom de famille). Exercice 2.3 : On note G n la fonction génératrice de N n et G G 1. On suppose que p 0 0 8. 1) Montrer que G n+1 (t) G n (G(t)) G(G n (t)). 2) En déduire que la suite x n vérifie les formules de récurrence x 1 G(0) et x n+1 G(x n ) et que la limite ξ lim n + x n existe. 3) Montrer que si µ 1 alors ξ 1. 4) si µ > 1 montrer que ξ < 1. 5) Montrer que ξ P( + n0 [N n 0]). solution : 1) D après la proposition 2.2, on a G n+1 (t) G n (G(t)) et par récurrence descendante, on obtient G n+1 (t) (G G)(t) (n+1 fois) donc par associativité de la composition des applications, on a aussi G n+1 (t) G(G n (t)). 2) On en déduit que x n+1 G n+1 (0) G(G n (0)) G(x n ) avec x 1 G(0) p 0. Mais la fonction G est strictement croissante 9 sur [0, 1] ; d où 0 < p 0 x 1 implique G(0) x 1 < G(x 1 ) x 2. Supposons par hypothèse de récurrence que x n 1 < x n, alors x n G(x n 1 ) < G(x n ) x n+1. Donc la suite x n est croissante ; comme elle est majorée par 1, elle est donc convergente vers une limite ξ ]0, 1] qui vérifie forcément ξ G(ξ) puisque la fonction G est continue. 3) Étudions les racines de l équation t G(t). D abord t 1 est racine évidente. Notons aussi que si on a deux racines t 1 G(t 1 ) et t 2 G(t 2 ) alors G(t 2) G(t 1 ) t 2 t 1 1 et donc il existe c ]t 1, t 2 [ tel que G (c) 1 d après le théorème des accroissements finis. Or la fonction G est strictement croissante sur [0, 1] ce qui prouve qu il existe un c unique dans [0, 1] tel que G (c) 1. On en conclut que l équation t G(t) a au plus deux racines dans [0, 1] donc au plus une racine dans [0, 1[ 10. S il y a effectivement une racine dans [0, 1[, il existe 11 c [0, 1[ tel que G (c) 1 donc comme G est strictement croissante, G (1) µ > 1. 7 attention la somme définissant N n doit être prise au sens de la formule (5) i.e. pour ω [N n 1 0], on a N n (ω) 0. 8 sinon il est clair qu il ne peut pas y avoir extinction. 9 c est sur série entière à coefficients 0 et il existe un coefficient p k > 0 pour un k 1. 10 car t 1 est racine. 11 d après ce qu on a vu plus haut. 6
Ainsi lorsque µ 1, il n y a pas de racine dans [0, 1[ et alors forcément, lim x n ξ 1. 4) Si µ > 1, il faut montrer que x n converge effectivement vers la racine ξ < 1. Ceci est facile 12, il suffit de remarquer que x 1 < ξ et que, par récurrence, pour tout n, x n < ξ (faire une figure). 5) Il est trivial de remarquer que les événements [N n 0] forment une suite croissante. Par la propriété de continuité de la probabilité par limite croissante 13, on obtient ξ lim x n P( + n0[n n 0]) P(extinction du nom de famille). Note à l attention des lecteurs : Merci de me signaler les coquilles ou erreurs que vous auriez pu remarquer dans ce fichier. Votre attention permettra d améliorer la prochaine version de ces notes de cours. 12 exercice de niveau L1. 13 théorème du chapitre deux. 7