Tble des mtières 1 Dénombrer et sommer 5 1.1 Rppels ensemblistes............................. 5 1.1.1 Opértions ensemblistes....................... 5 1.1.2 Bijections............................... 7 1.2 Ensembles finis et dénombrement...................... 8 1.3 Dénombrbilité................................ 16 1.4 Rppels sur les séries............................. 24 1.4.1 Générlités.............................. 24 1.4.2 Séries à termes positifs........................ 25 1.4.3 Séries à termes de signe non constnt................ 27 1.4.4 Opértions sur les séries....................... 28 1.5 Fmilles sommbles.............................. 34 1.6 Séries doubles................................. 46 2 Événements et Probbilités 51 2.1 Notion de mesure............................... 51 2.2 Modéliser l létoire............................. 57 2.2.1 Notion d expérience létoire.................... 57 2.2.2 Événements.............................. 58 2.2.3 Une question de dés......................... 59 2.3 L probbilité comme mesure........................ 62 2.4 Exemples................................... 68 2.5 Remrques sur le choix d un modèle..................... 75 2.6 Probbilités conditionnelles......................... 77 2.6.1 Introduction.............................. 77 2.6.2 Propriétés............................... 79 2.6.3 Quelques exemples.......................... 82 2.7 Indépendnce................................. 84 2.7.1 Indépendnce de deux événements.................. 84 2.7.2 Indépendnce mutuelle........................ 86 2.7.3 Épreuves répétées........................... 88 1
3 Vribles létoires 91 3.1 Introduction.................................. 91 3.2 Générlités.................................. 94 3.2.1 Vribles létoires réelles...................... 94 3.2.2 Loi d une vrible létoire..................... 96 3.2.3 Fonction de réprtition........................ 99 3.2.4 Lois à densité............................. 11 3.3 Lois discrètes clssiques........................... 16 3.3.1 Lois de Bernoulli........................... 17 3.3.2 Loi uniforme sur un ensemble fini de réels............. 17 3.3.3 Lois binomiles............................ 17 3.3.4 Lois hypergéométriques........................ 18 3.3.5 Lois géométriques........................... 11 3.3.6 Lois de Poisson............................ 111 3.3.7 Sur le crctère universel de l loi de Poisson............ 116 3.4 Lois à densité clssiques........................... 119 3.4.1 Lois uniformes............................. 119 3.4.2 Lois exponentielles.......................... 121 3.4.3 Lois gussiennes............................ 124 3.4.4 Lois de Cuchy............................ 125 4 Espérnce 127 4.1 Introduction.................................. 127 4.2 Espérnce d une vrible létoire positive................. 13 4.3 Espérnce d une vrible létoire réelle.................. 146 4.4 Moments.................................... 152 5 Vecteurs létoires et indépendnce 161 5.1 Vecteurs létoires.............................. 162 5.1.1 Générlités.............................. 162 5.1.2 Covrince............................... 171 5.2 Indépendnce de vribles et vecteurs létoires.............. 173 5.2.1 Suites indépendntes......................... 173 5.2.2 Indépendnce des composntes................... 178 5.2.3 Indépendnce et espérnce de produits............... 186 6 Théorèmes limites 191 6.1 Convergences de suites de v.......................... 191 6.1.1 Convergence presque sûre et en probbilité............. 191 6.1.2 Convergence en moyenne d ordre p................. 198 6.1.3 Biln sur les convergences de v.................... 23 6.2 Loi des grnds nombres............................ 24 6.2.1 Loi fible des grnds nombres.................... 24 6.2.2 Loi forte des grnds nombres..................... 26 2
6.2.3 L iguille de Buffon.......................... 28 A Intégrle de Riemnn sur [, b] 213 A.1 Construction................................. 213 A.2 Riemnn intégrbilité............................. 219 A.3 Propriétés de l intégrle de Riemnn.................... 226 A.3.1 Propriétés de l ensemble R[, b]................... 226 A.3.2 Propriétés reltives à l intervlle d intégrtion........... 232 A.4 Interversion limite intégrle......................... 238 B Intégrle générlisée 241 B.1 Construction................................. 241 B.2 Critère de Cuchy pour intégrles générlisées............... 251 B.3 Intégrles générlisées de fonctions positives................ 257 B.4 Divers..................................... 262 B.4.1 Chngements de vrible....................... 262 B.4.2 Intégrtion pr prties........................ 265 B.4.3 Comprison des intégrles ordinires et générlisées....... 267 Tbles de l loi normle stndrd 269 Ch. Suquet, Cours I.P.É. 21 3
4 Ch. Suquet, Cours I.P.É. 21
Chpitre 1 Dénombrer et sommer Compter des objets et fire des dditions, voilà bien les deux ctivités les plus élémentires à l bse des mthémtiques. Et pourtnt à y regrder de plus près, ce n est ps si fcile. Déjà pour un ensemble fini, l méthode qui consiste à regrder ses éléments l un près l utre et à les compter (donc à les numéroter) n est pplicble que pour de «petits» ensembles. Le plus souvent on s en sort en fisnt une représenttion de l ensemble à dénombrer à l ide d un utre ensemble plus fmilier. Cette représenttion est ce que l on ppelle une bijection. Elle est d illeurs à l bse du processus de comptge qui consiste simplement à mettre en bijection un ensemble vec un ensemble de nombres entiers. Cette notion de bijection permet d étendre en un certin sens le dénombrement ux ensembles infinis. L extension de l notion de somme d une suite finie de nombres à une suite infinie conduit nturellement à l notion de série que nous réviserons dns ce chpitre. L théorie des probbilités utilise implicitement une notion plus générle, celle de fmille sommble. Il s git de définir l somme, si elle existe, d une fmille de nombres indexée pr un ensemble infini qui n est ps forcément N ou N. Nous présentons cette théorie dns l dernière prtie du chpitre. Dns tout ce qui suit, l nottion {1,..., n} pour n N désigne l ensemble de tous les entiers compris u sens lrge entre 1 et n. L écriture un peu busive «i = 1,..., n» signifie «i {1,..., n}». 1.1 Rppels ensemblistes 1.1.1 Opértions ensemblistes Soit Ω un ensemble ; A est un sous-ensemble (ou une prtie) de Ω si tout élément de A est ussi un élément de Ω ( ω A, ω Ω). On note A Ω. On ppelle P(Ω) l ensemble des prties de Ω, ce que l on peut noter 1 P(Ω) = {A; A Ω}. 1. Dns toutes les écritures d ensembles entre ccoldes, nous utilisons le point virgule u sens de «tel que». 5
Chpitre 1. Dénombrer et sommer Ainsi les écritures A Ω et A P(Ω) sont deux fçons de dire l même chose 2. Si A et B sont deux prties du même ensemble Ω, on dit que A est incluse dns B (nottion A B) si tout élément de A est ussi élément de B ( ω A, ω B), utrement dit, si l pprtennce à A implique l pprtennce à B : A B signifie ω Ω, (ω A) (ω B). Soit I un ensemble quelconque d indices (fini ou infini) et (A i ) i I une fmille de prties de Ω. On définit son intersection A i et s réunion, A i pr : i I i I A i := {ω Ω; i I, ω A i } et A i = {ω Ω; i I, ω A i }. (1.1) i I i I Remrque 1.1. L réunion et l intersection d une fmille de prties de Ω sont définies de fçon globle, elles s obtiennent d un coup, sns pssge à l limite qund I est infini et sns qu un ordre éventuel sur l ensemble d indices I n it d importnce. Réunion et intersection sont très utiles pour l trduction utomtique des quntificteurs. Si I est un ensemble quelconque d indices, (π i ) une propriété dépendnt de l indice i et A i l ensemble des ω Ω vérifint (π i ), on : {ω Ω; i I, ω vérifie (π i )} = A i, i I {ω Ω; i = i(ω) I, ω vérifie (π i )} = A i. i I Ainsi le quntificteur peut se trduire pr une intersection et le quntificteur pr une réunion. L intersection et l union sont distributives l une pr rpport à l utre, c est à dire B ( ) A i i I = i I (A i B) B ( ) A i i I = i I (A i B). Le complémentire de A (dns Ω) est l ensemble A c := {ω Ω; ω / A}. L opértion pssge u complémentire (qui est une bijection de P(Ω) dns lui-même) vérifie (A c ) c = A, Ω c =, c = Ω et échnge réunions et intersections grâce ux très utiles formules : ( ) c A i = i I i I A c i ( ) c A i = A c i I i I i. On définit le produit crtésien de deux ensembles E et F, noté E F pr : E F := {(x, y); x E, y F }. Attention, dns cette écriture (x, y) ne désigne en ucune fçon un ensemble mis un couple d éléments (l ordre d écriture une importnce). Pour éviter toute confusion, 2. Noter cependnt l différence de sttut de A : dns l première écriture, A est considéré comme un ensemble, dns l deuxième comme un élément d un ensemble d un type un peu prticulier. 6 Ch. Suquet, Cours I.P.É. 21
1.1. Rppels ensemblistes on utilise des ccoldes pour l description des ensembles et des prenthèses pour les couples d éléments. On définit de mnière nlogue le produit crtésien d une suite finie d ensembles E 1,..., E n pr 3 E 1 E n := { (x 1,..., x n ); i = 1,..., n, x i E i }. L ensemble E 2 := E E = {(x 1, x 2 ); x 1 E, x 2 E} peut être utilisé pour représenter l ensemble de toutes les pplictions de {1, 2} dns E, le couple (x 1, x 2 ) correspondnt à l ppliction f : {1, 2} E définie pr f(1) = x 1 et f(2) = x 2. Il pourrit de l même fçon, représenter les pplictions d un ensemble à deux éléments dns E (remplcer les chiffres 1 et 2 pr n importe quelle pire de symboles distincts : et 1, et b, etc.). Plus générlement, pour n 2, E n est l ensemble des n-uplets ou listes de longueur n d éléments de E. Dns un n-uplet (x 1,..., x n ), il peut y voir des répétitions. On peut ussi utiliser E n pour représenter toutes les pplictions de l ensemble {1,..., n} (ou de n importe quel ensemble à n éléments) dns E. Soit I un ensemble quelconque, fini ou infini. Pr nlogie vec ce qui précède, l ensemble de toutes les pplictions f : I E ser noté E I. Pr exemple vec E = {, 1} et I = N, on obtient l ensemble {, 1} N de toutes les suites de chiffres binires indexées pr N : {, 1} N = {u = (u i ) i N ; u i = ou 1}. Avec E = R et I = [, 1], on obtient l ensemble R [,1] des fonctions définies sur l intervlle [, 1] et à vleurs dns R. 1.1.2 Bijections Définition 1.2 (injection). Une ppliction f : E F est dite injective si deux éléments distincts de E ont toujours des imges distinctes dns F : Une formultion équivlente est : x E, x E, (x x ) (f(x) f(x )). x E, x E, (f(x) = f(x )) (x = x ). Une ppliction injective f : E F est ppelée injection de E dns F. Définition 1.3 (surjection). Une ppliction f : E F est dite surjective si tout élément de l ensemble d rrivée u moins un ntécédent pr f : y F, x E, f(x) = y. Une ppliction surjective f : E F est ppelée surjection de E sur F. 3. Noter qu ici le quntificteur «i» ne se trduit ps pr une intersection. Ne confondez ps «i = 1,..., n, x E i» qui trduit l pprtennce de x à l intersection des E i vec «i = 1,..., n, x i E i». Ch. Suquet, Cours I.P.É. 21 7
Chpitre 1. Dénombrer et sommer Définition 1.4 (bijection). Une ppliction f : E F est dite bijective si elle est à l fois injective et surjective, utrement dit si tout élément de l ensemble d rrivée F un unique ntécédent pr f dns l ensemble de déprt E : y F,!x E, f(x) = y. Une ppliction bijective f : E F est ppelée bijection de E sur F. Remrque 1.5. Si f : E F est une injection, en restreignnt son ensemble d rrivée à f(e) := {y F ; x E; f(x) = y} l nouvelle ppliction f : E f(e) est une bijection. En effet cette opértion préserve clirement l injectivité et rend f surjective. Définition 1.6 (ppliction réciproque). Soit f : E F une bijection. Tout y F dmet un unique ntécédent x pr f dns E. En posnt f 1 (y) := x, on définit une ppliction f 1 : F E ppelée ppliction réciproque de f ou inverse de f. Cette ppliction f 1 est bijective. Justifiction. Pour vérifier l injectivité de f 1, soient y et y deux éléments de F tels que f 1 (y) = f 1 (y ). Cel signifie qu ils ont le même ntécédent x pr f, donc que y = f(x) et y = f(x), d où y = y. Pour l surjectivité, soit x E quelconque. Posons y = f(x). Alors x est ntécédent de y pr f, donc f 1 (y) = x et insi y est ntécédent de x pr f 1. Tout élément de E donc un ntécédent dns F pr f 1. Autrement dit, f 1 est surjective. Remrque 1.7. Ainsi l existence d une bijection E F équivut à celle d une bijection F E. On dir que E «est en bijection vec» F s il existe une bijection E F (ou F E). Proposition 1.8. Soient f : E F et g : F G deux bijections. Alors g f est une bijection de E sur G. De plus (g f) 1 = f 1 g 1. Preuve. Rppelons que (g f)(x) := g(f(x)) pour tout x E. Pour vérifier l injectivité, soient x et x dns E tels que (g f)(x) = (g f)(x ). Cette églité réécrite g(f(x)) = g(f(x )) implique pr injectivité de g l églité f(x) = f(x ), lquelle implique x = x pr injectivité de f. Pour l surjectivité de g f, soit z G quelconque. Pr surjectivité de g, z u moins un ntécédent y dns F vec g(y) = z. À son tour y F un ntécédent x E pr l surjection f. Finlement y = f(x) et z = g(y), d où z = g(f(x)) = (g f)(x), ce qui montre que z pour ntécédent x pr g f. Comme z étit quelconque, l surjectivité de g f est étblie. Ainsi g f est une bijection de E sur G. En conservnt les nottions on (g f) 1 (z) = x. D utre prt x = f 1 (y) et y = g 1 (z), d où x = f 1 (g 1 (z)) = (f 1 g 1 )(z). On donc pour z quelconque dns G l églité (g f) 1 (z) = x = (f 1 g 1 )(z), d où (g f) 1 = f 1 g 1. 1.2 Ensembles finis et dénombrement Définition 1.9. Un ensemble E est dit fini s il est vide ou s il est en bijection vec un ensemble {1,..., n} pour un certin entier n 1. Un tel n est lors unique et est ppelé crdinl de E (nottion crd E). Pr convention le crdinl de l ensemble vide est. 8 Ch. Suquet, Cours I.P.É. 21
1.2. Ensembles finis et dénombrement L cohérence de l définition 1.9 repose sur le lemme suivnt (pourquoi?). Lemme 1.1. Si n et m sont deux entiers distincts, il n existe ps de bijection entre {1,..., n} et {1,..., m}. Preuve. On peut toujours supposer sns perte de générlité que n < m. Dns le cs où n =, l ensemble {1,..., n} est l ensemble des entiers j tels que 1 j, c est donc l ensemble vide. On prouve le résultt pr récurrence sur n en doptnt comme hypothèse de récurrence : (H n ) m > n, il n existe ps de bijection {1,..., n} {1,..., m}. Initilistion. (H ) est clirement vrie, cr on ne peut définir ucune ppliction sur l ensemble vide donc fortiori ucune bijection. Induction. Montrons que si (H n ) est vérifiée pour un certin n, lors (H n+1 ) l est ussi. Pour cel on risonne pr l bsurde : si (H n+1 ) n étit ps ps vérifiée, il existerit un entier m > n + 1 et une bijection f : {1,..., n + 1} {1,..., m}. Nous llons construire à prtir de f une bijection g : {1,..., n + 1} {1,..., m} telle que g(n + 1) = m. Notons j = f(n + 1). Si j = m, il suffit de prendre g = f. Si j m, considérons l trnsposition τ : {1,..., m} {1,..., m} qui échnge j et m et lisse les utres éléments inchngés. C est une bijection et l ppliction composée g = τ f est une bijection {1,..., n + 1} {1,..., m} vérifint g(n + 1) = m. L restriction g de g à {1,..., n} est une bijection de {1,..., n} sur {1,..., m 1} et comme m > n + 1, on bien m 1 > n, ce qui contredit (H n ). Nous venons d étblir l impliction (H n ) (H n+1 ), ce qui chève l récurrence. Remrque 1.11. Si l ensemble F est en bijection vec un ensemble fini E, lors F est fini et même crdinl que E. En effet en notnt n = crd E, il existe une bijection f : {1,..., n} E et une bijection g : E F. L composée g f rélise lors une bijection de {1,..., n} sur F. Proposition 1.12. Soient E et F deux ensembles finis. Si E F =, crd(e F ) = crd E + crd F. (1.2) Preuve. Dns le cs où l un des deux ensembles est vide, (1.2) est trivile. On suppose désormis que crd E = n 1 et crd F = m 1. Il existe lors des bijections f : {1,..., n} E, g : {1,..., m} F. On prouve (1.2) en construisnt une bijection h de {1,..., n + m} sur E F. L trnsltion t : {n + 1,..., n + m} {1,..., m}, i i n est une bijection et l ppliction g t rélise une bijection de {n + 1,..., n + m} sur F. Définissons lors h pr { f(i) si i {1,..., n}, h(i) := (g t)(i) si i {n + 1,..., n + m}. Ch. Suquet, Cours I.P.É. 21 9
Chpitre 1. Dénombrer et sommer Pour vérifier l surjectivité de h, soit z un élément quelconque de E F. Si z E, lors il un ntécédent i dns {1,..., n} pr l surjection f et comme h(i) = f(i) = z, i est ussi ntécédent de z pr h. Si z F, il un ntécédent j dns {1,..., m} pr l surjection g et j un ntécédent i dns {n + 1,..., n + m} pr l surjection t. Alors h(i) = g(t(i)) = g(j) = z donc i est ntécédent de z pr h. Pour vérifier l injectivité de h, notons i et i deux éléments distincts de {1,..., n+m}. S ils sont l un dns {1,..., n} et l utre dns {n + 1,..., n + m}, leurs imges h(i) et h(i ) sont l une dns E et l utre dns F qui sont disjoints (E F = ) donc h(i) h(i ). sinon i et i sont tous deux dns {1,..., n} (resp. dns {n+1,..., n+m}) et h(i) h(i ) en rison de l injectivité de f (resp. de g t). Corollire 1.13 (de l proposition 1.12). ) Si E 1,..., E d sont d ensembles finis deux à deux disjoints, E 1 E d est un ensemble fini et ( ) d d crd = crd E i. i=1 E i b) Si E et F sont des ensembles finis quelconques (ps forcément disjoints), E F est fini et crd(e F ) = crd E + crd F crd(e F ). Preuve. Lissée en exercice. Proposition 1.14. Soient E et F deux ensembles finis. Leur produit crtésien pour crdinl crd(e F ) = crd E crd F. (1.3) Preuve. Le cs où l un des deux ensembles E ou F est vide étnt trivil, on suppose désormis qu ucun des deux n est vide. On fit une récurrence sur n = crd E, en prennt pour hypothèse de récurrence : (H n ) si crd E = n, lors crd(e F ) = n crd F pour tout F fini non vide. Initilistion. Si crd E = 1, E n qu un élément x 1 et l ppliction h : {x 1 } F F, (x 1, y) y est clirement une bijection donc crd({x 1 } F ) = crd F et (H 1 ) est vérifiée. Induction. Supposons (H n ) vrie pour un certin n et soit E un ensemble de crdinl n+1. Il existe une bijection f : {1,..., n+1} E permettnt de numéroter les éléments de E en posnt pour tout i {1,..., n + 1}, x i := f(i). L restriction de f à {1,..., n} est une bijection de {1,..., n} sur son imge E = {x 1,..., x n }. Ainsi E est de crdinl n et E est l union de ses deux sous-ensembles disjoints E et {x n+1 }. On en déduit imméditement que E F est l union des deux produits crtésiens disjoints E F et {x n+1 } F. Pr l proposition 1.12 on lors i=1 crd(e F ) = crd(e F ) + crd({x n+1 } F ). 1 Ch. Suquet, Cours I.P.É. 21
1.2. Ensembles finis et dénombrement En utilisnt (H n ) et (H 1 ), on obtient lors donc (H n+1 ) est vérifiée. crd(e F ) = n crd F + crd F = (n + 1) crd F, Remrque 1.15. On urit pu ussi prouver (1.3) en construisnt explicitement une bijection E F {1,..., nm} (vec crd E = n et crd F = m). Voici une fçon de l construire. On note f : {1,..., n} E, i x i := f(i) et g : {1,..., m} F, j y j := g(j) des numérottions bijectives de E et F. On définit lors h : E F {1,..., nm} en posnt h(x i, y j ) := m(i 1) + j, ou de mnière plus formelle h(x, y) := m(f 1 (x) 1) + g 1 (y) pour tout (x, y) E F. On lisse en exercice l vérifiction de l bijectivité de h. L idée de s construction est simplement de rnger les couples éléments de E F sous l forme d un tbleu où le couple (x i, y j ) se trouve à l intersection de l ligne i et de l colonne j et de numéroter les éléments de ce tbleu en blynt chque ligne de guche à droite de l ligne 1 jusqu à l ligne n. Corollire 1.16 (de l proposition 1.14). Si E 1,..., E d sont d ensembles finis, crd(e 1 E d ) = d crd E i. Preuve. Une récurrence immédite sur d fournit le résultt. Proposition 1.17 (nombre d pplictions E F et crdinl de P(E)). () Si crd E = n et crd F = p, l ensemble F E des pplictions de E dns F est fini et pour crdinl p n, utrement dit : i=1 crd ( F E) = (crd F ) crd E. (b) Comme P(E) est en bijection vec l ensemble {, 1} E des pplictions de E dns {, 1}, crd P(E) = 2 n = 2 crd E. Preuve. Le () se démontre fcilement pr récurrence sur le crdinl de E, en notnt que si on joute un élément x n+1 à E, il y p fçons différentes de prolonger f : E F en ttribunt comme imge à x n+1 l un des éléments de F. L rédction détillée est lissée en exercice. Une bijection nturelle entre P(E) et {, 1} E est l ppliction ϕ qui à toute prtie A de E ssocie s fonction indictrice : ϕ : P(E) {, 1} E A ϕ(a) := 1 A. Rppelons que l indictrice d une prtie A de E est l ppliction { 1 si ω A, 1 A : E {, 1} ω 1 A (ω) := si ω / A. L vérifiction de l bijectivité de ϕ est lissée en exercice 4. 4. Ni l définition de ϕ, ni l preuve de s bijectivité n utilisent l finitude de E. Ainsi P(E) et {, 1} E sont en bijection quel que soit l ensemble E, fini ou infini. Ch. Suquet, Cours I.P.É. 21 11
Chpitre 1. Dénombrer et sommer Définition 1.18 (rrngement). Si E est un ensemble de crdinl n et k un entier tel que 1 k n, on ppelle rrngement de k éléments de E tout k-uplet (x 1, x 2,..., x k ) d éléments tous distincts de E. Un tel rrngement représente une injection de {1,..., k} dns E. Proposition 1.19 (dénombrement des rrngements). Le nombre d rrngements de k éléments de E (1 k n = crd E) est A k n = n(n 1)(n 2) (n k + 1) = n! (n k)!. (1.4) A k n est ussi le nombre d injections d un ensemble I de crdinl k, pr exemple {1,..., k}, dns E. En prticulier pour I = E (et donc k = n), on obtient le nombre de bijections de E dns lui même (ppelées ussi permuttions de E) : nombre de permuttions de E = A n n = n! Preuve. On prouve (1.4) pr récurrence finie sur k, le cs k = 1 étnt évident. Supposons donc (1.4) vrie pour un k < n et montrons qu lors elle est ussi vrie pour k + 1. Une ppliction f : {1,..., k+1} E est déterminée de mnière unique pr l donnée de s restriction f à {1,..., k} et de f(k +1). L ppliction f est injective si et seulement si s restriction f est injective et f(k+1) / f({1,..., k}). Comme le crdinl de f({1,..., k}) est k, cel lisse n k choix possibles pour f(k + 1). On en déduit que A k+1 n = A k n(n k) = n(n 1)(n 2) (n k + 1)(n k), ce qui montre que (1.4) est vérifiée u rng k + 1. Définition 1.2 (combinison). On ppelle combinison de k éléments de E (1 k n = crd E) toute prtie de crdinl k de E. Une combinison tous ses éléments distincts comme un rrngement, mis l ordre d écriture n ps d importnce. Proposition 1.21 (dénombrement des combinisons). Le nombre de combinisons de k éléments de E (1 k n = crd E) est C k n = n(n 1)(n 2) (n k + 1) k(k 1) 1 = n! k!(n k)!. (1.5) Preuve. Notons A k (E) l ensemble de tous les rrngements de k éléments de E. Il est lors clir que l on l décomposition en réunion d ensembles disjoints A k (E) = A k (B). (1.6) B E, crd B=k Autrement dit on prtitionné A k (E) en regroupnt dns une même clsse A k (B) tous les rrngements formés à prtir des éléments d une même prtie B de crdinl k. Il 12 Ch. Suquet, Cours I.P.É. 21
1.2. Ensembles finis et dénombrement y donc utnt de clsses distinctes dns cette décomposition que de prties B de crdinl k dns E, c est-à-dire Cn k clsses. D utre prt chque clsse A k (B) contient utnt d rrngements que de bijections B B (ou permuttions sur B), c est-à-dire k!. Compte-tenu du corollire 1.13 ), on déduit lors de (1.6) que : crd A k (E) = crd A k (B) = Cnk!. k B E, crd B=k Or crd A k (E) = A k n pr l définition des A k n, d où A k n = C k nk!, ce qui donne (1.5). Les nombres C k n sont ppelés ussi coefficients binomiux en rison de leur rôle dns l formule du binôme de Newton, que nous retrouverons ci-dessous (corollire 1.24) comme cs prticulier de l formule du multinôme. Avnt de nous y ttquer, il n est peut-être ps inutile de fire un rppel sur le développement d un produit de sommes finies. Proposition 1.22. Soient J 1,..., J n des ensembles finis non vides d indices et pour i = 1,..., n, j J i, des nombres réels ou complexes x i,j. En notnt K n := J 1 J n, on ( ) ( n n ) = x i,ji = ( n )... x i,ji. (1.7) i=1 i=1 j 1 J 1 i=1 j J i x i,j (j 1,...,j n) K n j n J n Voici une trduction sns formules de cet énoncé : «le produit de n sommes finies est égl à l somme de tous les produits de n fcteurs que l on peut former en sélectionnnt un fcteur prmi les termes de chcune des n sommes». L figure 1.1 illustre l ppliction de cette règle u développement de ( + b + c)(d + e)(s + t + u + v). Ici J 1 = {1, 2, 3}, x 1,1 =,..., x 1,3 = c, J 2 = {1, 2}, x 2,1 = d, x 2,2 = e, J 3 = {1,..., 4}, x 3,1 = s,..., x 3,4 = v. L proposition 1.22 se démontre fcilement pr récurrence sur n. Proposition 1.23 (formule du multinôme). Pour tous entiers d 2, n 2 et tous nombres réels ou complexes 1,..., d, ( 1 + + d ) n = (k 1,...,k d ) N d k 1 + +k d =n n! k 1!... k d! k 1 1... k d d. (1.8) Preuve. On commence pr ppliquer l formule (1.7) vec J 1 = = J n = {1,..., d} pour obtenir : ( ) n ( ) ( ) 1 + + d = 1 + + d 1 + + d = i1... in. } {{ } (i n prenthèses 1,...,i n) {1,...,d} n (1.9) Prmi les n fcteurs du produit i1... in, il peut y voir des répétitions et il peut ussi mnquer certins des i. En regroupnt les fcteurs identiques, on peut toujours écrire ce produit sous l forme k 1 1... k d d, où pour j = 1,..., d, on noté k j le nombre de fcteurs égux à j dns ce produit (éventuellement k j = si j ne figure ps dns le Ch. Suquet, Cours I.P.É. 21 13
Chpitre 1. Dénombrer et sommer ds dt du dv es et eu ev bds bdt bdu bdv bes bet beu bev cds cdt cdu cdv ces cet ceu cev Fig. 1.1 Arbre de développement de ( + b + c)(d + e)(s + t + u + v) produit). Comme il y n fcteurs, les k j vérifient k 1 + + k d = n. Notons mintennt M(n, k 1,..., k d ), le nombre d ppritions du produit k 1 1... k d d dns le développement de ( 1 + + d ) n. Avec cette nottion, on peut réécrire (1.9) sous l forme ( ) n 1 + + d = M(n, k 1,..., k d ) k 1 1... k d d. (1.1) (k 1,...,k d ) N d k 1 + +k d =n Il ne nous reste plus qu à fire un peu de dénombrement pour expliciter le coefficient M(n, k 1,..., k d ) pour k 1,..., k d entiers fixés tels que k 1 + + k d = n. Cel revient à compter de combien de fçons on peut choisir les k 1 prenthèses fournissnt 1, les k 2 prenthèses fournissnt 2,..., les k d prenthèses fournissnt d, pour former le produit k 1 1... k d d. Commençons pr choisir les k 1 prenthèses dont l contribution est 1, ceci peut se fire de C k 1 n fçons. Prmi les n k 1 prenthèses restntes, on choisit ensuite les 14 Ch. Suquet, Cours I.P.É. 21
1.2. Ensembles finis et dénombrement k 2 prenthèses qui fournissent 2, ce qui nous lisse C k 2 n k 1 possibilités. Et insi de suite, jusqu u choix de k d prenthèses prmi les n k 1 k d 1 dernières 5 pour obtenir d. On en déduit que M(n, k 1,..., k d ) = C k 1 n C k 2 n k 1 C k 3 n k 1 k 2 C k d n k 1 k d 1 = n! k 1!(n k 1 )! (n k 1 )! k 2!(n k 1 k 2 )! (n k 1 k 2 )! k 3!(n k 1 k 2 k 3 )! = (n k 1 k d 1 )! k d!(n k 1 k d )! n! k 1!... k d!, près simplifictions et en notnt que (n k 1 k d )! =! = 1. Les nombres M(n, k 1,..., k d ) sont ppelés coefficients multinomiux. On peut ussi les interpéter comme ) le nombre de fçons de réprtir les éléments d un ensemble de crdinl n en d sous-ensembles de crdinl respectif k 1,..., k d ; b) le nombre d pplictions f de {1,..., n} dns {1,..., d} telles que chque i dns {1,..., d} it exctement k i ntécédents dns {1,..., n} pr f. Notons en pssnt que d près l interpréttion b), le nombre totl d pplictions de {1,..., n} dns {1,..., d}, soit d n d près l proposition 1.17 ), doit être égl à l somme de tous les M(n, k 1,..., k d ), ce qui s écrit : d n = M(n, k 1,..., k d ). (k 1,...,k d ) N d k 1 + +k d =n C est bien ce que donne l formule du multinôme en prennt tous les i égux à 1 dns (1.8). Corollire 1.24 (formule du binôme). Pour tous réels ou complexes et b et tout entier n 2, ( + b) n = n! n k!l! k b l = Cn k k b n k. (1.11) (k,l) N 2 k+l=n Preuve. Il suffit d pplique l formule du multinôme vec d = 2, 1 =, 2 = b. Remrque 1.25. Dns le clcul des M(n, k 1,..., k d ) ci-dessus, il peut sembler que l on it vntgé les 1 en commençnt pr les choisir en premier et pénlisé les d en les grdnt pour l fin. Vous pourrez vous convincre qu il n en est rien en refisnt ce clcul en plçnt les i dns l ordre qui vous convient, pr exemple en commençnt pr d, ou pr 3,.... 5. Comme n k 1 k d 1 = k d, il n y qu un seul choix possible à ce stde : prendre toutes les prenthèses restntes. k= Ch. Suquet, Cours I.P.É. 21 15
Chpitre 1. Dénombrer et sommer Voici d illeurs une suggestion pour une preuve lterntive qui pourrit être développée en exercice. On considère l ensemble S n de toutes les permuttions de {1,..., n}. Son crdinl est n!. Fixons k 1,..., k d entiers de somme n. On pose E i = {1 + k i 1,..., k i }, vec k := et i = 1,..., d. Si (F 1,..., F d ) est un d-uple de prties de {1,..., n}, deux à deux disjointes et de réunion {1,..., n}, combien y -t-il de bijections f S n vérifint f(e i ) = F i pour tout i = 1,..., d? En déduire que n! = M(n, k 1,..., k d )k 1!... k d!. 1.3 Dénombrbilité On peut comprer les ensembles finis pr leur nombre d éléments. Cette notion n plus de sens pour des ensembles infinis. Nénmoins on peut générliser cette comprison en disnt que deux ensembles ont même crdinl s ils sont en bijection. Ceci permet de comprer les ensembles infinis. Il convient de se méfier de l intuition cournte bsée sur les ensembles finis. Pr exemple si A et B sont finis et A est inclus strictement dns B, lors crd A < crd B et il n existe ps de bijection entre A et B. Ceci n est plus vri pour les ensembles infinis. Pr exemple N est strictement inclus dns N mis est en bijection vec N pr l ppliction f : N N, n n + 1, donc N et N ont même crdinl. Nous nous intéressons mintennt ux ensembles ynt même crdinl que N. Définition 1.26. Un ensemble est dit dénombrble s il est en bijection vec N. Il est dit u plus dénombrble s il est fini ou dénombrble. Exemple 1.27. L ensemble 2N des entiers pirs est dénombrble. Pour le voir, il suffit de considérer l ppliction f : N 2N, n 2n qui est clirement une bijection. On vérifie de même que l ensemble des entiers impirs est dénombrble. Exemple 1.28. L ensemble Z est dénombrble. On peut en effet «numéroter» les entiers reltifs pr les entiers nturels en s inspirnt du tbleu suivnt. Z... 4 3 2 1 +1 +2 +3 +4... N... 8 6 4 2 1 3 5 7... Plus formellement, définissons l ppliction f : N Z pr { n+1 si n est impir, 2 n N, f(n) = n si n est pir. 2 Pour vérifier que f est une bijection, montrons que pour tout k Z donné, l éqution f(n) = k une solution unique. Si k >, il ne peut voir d ntécédent pir pr f puisque f envoie l ensemble des entiers pirs dns Z. L éqution f(n) = k se réduit donc dns ce cs à n+1 = k qui pour unique solution n = 2k + 1. Si k, il ne peut 2 voir d ntécédent impir pr f et l éqution f(n) = k se réduit à n = k qui pour 2 unique solution n = 2k. Ainsi f est bien une bijection puisque tout élément k de Z un ntécédent n unique pr f. L bijection inverse est donnée pr { k Z, f 1 2k + 1 si k >, (k) = 2k si k. 16 Ch. Suquet, Cours I.P.É. 21
1.3. Dénombrbilité Exemple 1.29. L ensemble N 2 est dénombrble. Cet exemple relève de l proposition 1.34 ci-dessous, mis l vérifiction directe est instructive. Voici une fçon de construire une bijection f : N 2 N. L idée est de fbriquer une numérottion des couples de N 2 pr les entiers en s inspirnt du schém de l figure 1.29. Un peu de j 14 9 13 5 8 12 2 4 7 11 16 1 3 6 1 15 i Fig. 1.2 Une numérottion des couples (i, j) de N 2 dénombrement nous conduit à proposer l définition 6 (i, j) N 2, f(i, j) := (i + j)(i + j + 1) 2 Preuve. L vérifiction de l bijectivité de f repose sur l remrque suivnte. Définissons l suite (u k ) k N pr k(k + 1) k N, u k :=. 2 Il s git clirement d une suite strictement croissnte d entiers, de premier terme u =. On donc l N,!k = k l N, u k l < u k+1. (1.12) De plus, + j. si l = f(i, j), k l = i + j et l = u kl + j. (1.13) Surjectivité de f. Soit l quelconque dns N et k = k l défini pr (1.12). Posons j = l u k et i = k j. Alors f(i, j) = (i + j)(i + j + 1) 2 + j = k(k + 1) 2 + j = u k + l u k = l. Le couple (i, j) insi défini à prtir de l est donc ntécédent de l pr f et comme l étit quelconque, f est surjective. 6. Justifiction lissée en exercice. Ch. Suquet, Cours I.P.É. 21 17
Chpitre 1. Dénombrer et sommer Injectivité de f. Soient (i, j) et (i, j ) tels que f(i, j) = f(i, j ) et notons l cette vleur commune. D près (1.13), on k l = i + j = i + j et l = u kl + j = u kl + j. On en déduit imméditement que j = j, puis que i = i, d où (i, j) = (i, j ), ce qui étblit l injectivité de f. Lemme 1.3. Toute prtie infinie de N est dénombrble. Preuve. Soit E une prtie infinie de N. On construit une bijection f de N sur E pr récurrence en utilisnt le fit que toute prtie non vide de N dmet un plus petit élément. On initilise l récurrence en posnt : E := E, f() := min E. Ensuite, pour n 1, si on défini f(k) et E k pour k =,..., n 1, on pose E n := E \ f({,..., n 1}), f(n) := min E n. L ensemble f({,..., n 1}) = {f(),..., f(n 1)} est fini donc E n est non vide puisque E est infini. On peut donc bien construire insi de proche en proche tous les f(n) pour n N. De plus il est clir pr construction que pour tout n 1, f(n 1) < f(n). L ppliction f est donc strictement croissnte, ce qui entrîne son injectivité. Pour voir qu elle est surjective, soit m un élément quelconque de E. Comme m est un entier, il n y qu un nombre fini d entiers strictement inférieurs à m, donc fortiori qu un nombre fini n d éléments de E inférieurs strictement à m (éventuellement ucun). Ainsi m est le (n + 1)-ième plus petit élément de E, d où f(n) = m (comme on commence à, n est le (n + 1)-ième plus petit entier de N). Nous venons de montrer qu un élément quelconque de E u moins un ntécédent pr f, utrement dit que f est surjective. Proposition 1.31. Toute prtie infinie d un ensemble dénombrble est elle-même dénombrble. Preuve. Soit A une prtie infinie d un ensemble dénombrble B. Il existe lors une bijection g : B N. S restriction g à A est une bijection de A sur g(a). L ensemble g(a) est une prtie infinie de N, cr si elle étit finie, il en serit de même pour A. Pr le lemme 1.3, il existe une bijection f de g(a) sur N. L ppliction f g : A N est une bijection comme composée de deux bijections. L ensemble A est donc dénombrble. Remrque 1.32. L proposition 1.31 nous permet de crctériser les ensembles u plus dénombrbles comme ceux qui sont en bijection vec une prtie de N, ou encore comme ceux qui s injectent dns N. De même, les ensembles dénombrbles sont les ensembles infinis qui s injectent dns N. Remrque 1.33. Il résulte imméditement de l proposition 1.31 que si l ensemble B contient une prtie infinie A non dénombrble, B est lui même infini non dénombrble. Proposition 1.34. Le produit crtésien d une suite finie d ensembles dénombrbles est dénombrble. 18 Ch. Suquet, Cours I.P.É. 21
1.3. Dénombrbilité Preuve. Notons E 1,..., E n l suite finie d ensembles dénombrbles considérée. Pour i = 1,..., n, nous disposons d une bijection E i N, qui pr composition vec l bijection N N, n n + 1 donne une bijection f i : E i N. Comme E = E 1 E n est clirement un ensemble infini, il nous suffit de construire une injection de E dns N. Pour cel il est commode d utiliser les nombres premiers dont nous notons (p j ) j 1 l suite ordonnée : p 1 = 2, p 2 = 3, p 3 = 5, p 4 = 7, p 5 = 11,... Définissons f : E N, pr x = (x 1,..., x n ) E, f(x) := p f 1(x 1 ) 1... p fn(xn) n = n j=1 p f j(x j ) j. Remrquons que pour tout x E, f(x) 2 f 1(x 1 ) 2. Pour vérifier l injectivité de f, soient x et y dns E tels que f(x) = f(y). En vertu de l unicité de l décomposition en fcteurs premiers d un entier supérieur ou égl à 2, cette églité équivut à : i = 1,..., n, f i (x i ) = f i (y i ). Comme chque f i est injective, ceci entrîne l églité x i = y i pour tout i, d où x = y. Corollire 1.35. Pour tout entier d 1, N d, Z d sont dénombrbles. L ensemble Q des nombres rtionnels est dénombrble (de même que Q d, d 1). Vérifiction. L dénombrbilité de Q s obtient fcilement en l injectnt dns le produit crtésien d ensembles dénombrbles Z N vi l unicité de l écriture en frction irréductible (vec dénominteur positif) d un rtionnel. Les utres ffirmtions du corollire découlent imméditement de l Proposition 1.34. Voici un premier exemple d ensemble infini non dénombrble. Proposition 1.36. L ensemble {, 1} N des suites infinies de ou de 1 est infini mis n est ps dénombrble. Il est clir que {, 1} N est un ensemble infini, puisque qu il contient un sous-ensemble en bijection vec N, pr exemple l ensemble de suites {( 1 {n} (k) ) k N, n N}. Preuve. Supposons que {, 1} N soit dénombrble, on peut lors numéroter ses éléments pr les entiers, de sorte que {, 1} N = {x n ; n N}, chque x n étnt une suite (x n,k ) k N de chiffres binires. Construisons lors l suite y = (y k ) k N de chiffres binires en posnt : { 1 si x k,k = k N, y k = 1 x k,k = si x k,k = 1. Alors pr construction, l suite y diffère de chque suite x n (u moins pr son n e terme). Or y est un élément de {, 1} N, donc l numérottion considérée ne peut être surjective. Ch. Suquet, Cours I.P.É. 21 19
Chpitre 1. Dénombrer et sommer Corollire 1.37. P(N) n est ps dénombrble. Le segment [, 1] de R n est ps dénombrble. R n est ps dénombrble, C n est ps dénombrble. Un intervlle de R est soit infini non dénombrble, soit réduit à un singleton, soit vide. Preuve. Comme P(N) est en bijection vec {, 1} N pr l ppliction A 1 A, P(N) est infini non dénombrble. D près l remrque 1.33, l non dénombrbilité de R ou de C résulte imméditement de celle de [, 1]. Pour vérifier cette dernière, nous utilisons à nouveu l remrque 1.33 en construisnt une prtie de [, 1] en bijection vec {, 1} N. L première idée qui vient à l esprit pour une telle construction est d utiliser le développement des nombres réels en bse 2. Mis pour éviter les difficultés techniques liées à l existence de développements propre et impropre pour les nombres de l forme k2 n, nous utiliserons plutôt l bse 3 en ne conservnt que les chiffres binires et 1. Définissons donc 7 f : {, 1} N [, 1], u = (u k ) k N f(u) := + k= u k 3 k+1. Comme les u k ne peuvent prendre que les vleurs ou 1, l série à termes positifs définissnt f(u) converge puisque son terme générl vérifie l encdrement u k 3 k 1 3 k 1. S somme f(u) vérifie donc f(u) + k= 1 3 = 1 1 k+1 3 1 1 3 = 1 2. Ainsi f est bien une ppliction de {, 1} N dns [, 1] et d près l remrque 1.5, il suffit de vérifier son injectivité pour qu elle rélise une bijection de {, 1} N sur son imge A := {f(u); u {, 1} N }. Pr l proposition 1.36, on en déduir l non dénombrbilité de A. Pour montrer l injectivité de f, supposons qu il existe deux suites u u éléments de {, 1} N telles que f(u) = f(u ). Comme u u, l ensemble des entiers k tels que u k u k est non vide et donc un plus petit élément que nous notons j. On insi u k = u k pour tout k < j et u j u j. Quitte à permuter u et u, on ne perd ps de générlité en supposnt que u j = 1 et u j =. L églité f(u) = f(u ) implique lors : 1 3 = + j+1 k=j+1 u k u k 3 k+1. Comme u k u k ne peut prendre que les vleurs 1, ou 1, il est mjoré pr 1, d où : 1 3 + j+1 k=j+1 1 3 = 1 1 k+1 3 j+2 1 1 3 = 1 2 3 j+1, 7. L lecture de ce qui suit requiert l connissnce des séries dont les principles propriétés sont rppelées section 1.4 ci-près, voir notmment les séries géométriques (exemple 1.49). 2 Ch. Suquet, Cours I.P.É. 21
1.3. Dénombrbilité ce qui est impossible. On en déduit que si f(u) = f(u ), nécessirement u = u, ce qui étblit l injectivité de f. Pour vérifier l non dénombrbilité d un intervlle non vide et non réduit à un singleton de R, il suffit de remrquer que cet intervlle u moins deux éléments et b et qu il contient lors [, b]. Il suffit mintennt de construire une bijection [, 1] [, b]. L ppliction f : [, 1] [, b], t t + (1 t)b fit l ffire. Remrque 1.38. Il est fcile de construire une bijection entre ] 1, 1[ et R, pr exemple x tn(πx/2) et d en déduire une bijection entre R et n importe quel intervlle ouvert non vide. En fit on peut montrer que les ensembles suivnts ont tous même crdinl : {, 1} N, R, C, tout intervlle non vide et non réduit à un singleton de R. On dit qu ils ont l puissnce du continu. Sns ller jusqu à démontrer complètement cette ffirmtion, nous nous contenterons de présenter ci-dessous une construction explicite d une bijection entre {, 1} N et [, 1[. Il est clir que {, 1} N est lui même en bijection vec {, 1} N (pourquoi?). Exemple 1.39 (une bijection entre {, 1} N et [, 1[). Commençons pr un rppel sur le développement en bse 2 des réels de [, 1[, i.e. l existence pour un x [, 1[ d une suite ( k ) k N {, 1} N telle que + k x = 2. (1.14) k k=1 On ppelle nombre dydique de [, 1[, tout x [, 1[ de l forme k2 n vec k N et n N. Un tel dydique dmet une écriture irréductible unique de l forme l2 n vec l impir. Notons l ensemble des dydiques de [, 1[. Si x [, 1[\, il existe une unique suite ( k ) k N {, 1} N vérifint (1.14). De plus cette suite ( k ) k N comporte à l fois une infinité de et une infinité de 1. Si x, il existe deux suites ( k ) k N {, 1} N et ( k ) k N {, 1}N vérifint (1.14). L une ( k ) k N tous ses termes nuls à prtir d un certin rng. C est le développement propre du dydique x. L utre tous ses termes égux à 1 à prtir d un certin rng, c est le développement impropre de x. Nous noterons p(x) le développement propre de x et i(x) son développement impropre. Pr exemple le dydique 3 pour développemment propre (, 1, 1,,,,,... ) cr 3 = 1 + 1. Son développement impropre est 8 8 4 8 (, 1,, 1, 1, 1, 1,... ) puisque 1 = + 8 k=4 2 k. Définissons mintennt f : [, 1[ {, 1} N comme suit. Si x [, 1[\, on prend pour f(x) l unique suite ( k ) k N {, 1} N vérifint (1.14). Si x et x, x 1/2, il existe une écriture unique x = l2 n vec l impir. On pose lors ( l ) f = 2 n ( l + 1 ) i ( 2 n l 1 ) p 2 n si l = 1 mod 4, si l = 3 mod 4. Ch. Suquet, Cours I.P.É. 21 21
Chpitre 1. Dénombrer et sommer Pour f() on prend l suite ne comportnt que des et pour f(1/2) l suite ne comportnt que des 1. 1 8 1 4 3 8 1 2 3 4 5 7 8 8 Fig. 1.3 Arbre binire des dydiques de ], 1[ Le mécnisme de construction de f sur les dydiques utres que et 1/2 peut être décrit de mnière informelle à l ide de l rbre binire de l figure 1.3. Chque individu de cet rbre hérite un développement binire de son scendnt direct et engendre lui même deux enfnts et deux développements binires. L enfnt de guche hérite du développement impropre et celui de droite du développement propre. L compréhension de l définition de f demndnt plus d effort que l vérifiction de s bijectivité, ce dernier point est lissé u lecteur. Proposition 1.4. Soit J un ensemble u plus dénombrble d indices et pour tout j J, soit A j un ensemble u plus dénombrble. Alors A := j J A j est u plus dénombrble. Preuve. Le cs J = est trivil puisqu lors A =. Si tous les A j sont vides, A l est ussi (quel que soit J). On suppose désormis que J n est ps vide et qu u moins un des A j est non vide. On v montrer que A est u plus dénombrble en construisnt une injection h de A dns N. On peut trduire les hypothèses en écrivnt qu il existe une injection 8 f : J N et que pour tout j tel que A j, il existe une injection g j : A j N. Admettons pour un instnt que l on peut construire une fmille (A j) j J d ensembles deux à deux disjoints tels que pour tout j J, A j A j et que A = j J A j = j J A j. On définit lors l ppliction h : A N comme suit. Si x A, il existe un unique j J tel que x A j. On pose lors : h(x) := p g j(x) f(j), 8. Toute injection d un ensemble dns N peut se trnsformer en injection du même ensemble dns N pr composition vec l bijection N N, n n + 1. 22 Ch. Suquet, Cours I.P.É. 21
1.3. Dénombrbilité où p k désigne le k-ième nombre premier. Remrquons que h(x) 2 puisque f(j) 1, l suite (p k ) est croissnte de premier terme p 1 = 2 et g j (x) 1. Pour vérifier l injectivité de h, soient x et y dns A tels que h(x) = h(y). En notnt l l unique indice tel que y A l, cette églité s écrit p g j(x) f(j) = p g l(y) f(l). En rison de l unicité de l décomposition d un entier n 2 en fcteurs premiers, ceci entrîne f(j) = f(l) et g j (x) = g l (y), puis pr injectivité de f, j = l et g j (x) = g j (y). Comme g j est injective, on en déduit que x = y. L injectivité de h est insi étblie. Il reste à justifier l construction de l fmille (A j) j J. On commence pr trnsporter l ordre de N sur J vi l ppliction f en écrivnt pour j, l J, que j l signifie que f(j) f(l). Ceci nous permet de noter les éléments de J en suivnt cet ordre J = {j, j 1,...}, où j j 1.... Ensuite on construit A j pr récurrence en posnt A j := A j, B j := A j A j 1 := A j1 (A \ B j ), B j1 := B j A j1 A j 2 := A j2 (A \ B j1 ), B j2 := B j1 A j2............ Les détils de l vérifiction sont lissés u lecteur. Proposition 1.41 (dénombrbilité pr imge surjective). Soient A et B deux ensembles tels qu il existe une surjection f de A sur B. Alors si A est dénombrble, B est u plus dénombrble. Si A est fini, B est fini et crd B crd A. Il est possible que A soit infini et B fini, un exemple évident étnt fourni pr l ppliction nulle f : x de A = N dns B = {} qui est clirement une surjection. Preuve. Supposons A dénombrble. Définissons sur A l reltion d équivlence x x si f(x) = f(x ). Les clsses d équivlences pour cette reltion rélisent une prtition de A. Dns chque clsse d équivlence, choisissons un représentnt prticulier 9. Soit A l prtie de A formée de tous les représentnts insi choisis. Si x et x sont deux éléments distincts de A, ils sont dns deux clsses c et c disjointes, donc f(x) f(x ). L restriction de f à A est donc injective. Pr illeurs, puisque f est surjective, tout y B u moins un ntécédent x dns A. Si c est l clsse de x, il y dns cette clsse un (unique) élément de A qui lui ussi y pour imge pr f. Donc l restriction de f à A reste surjective et c est finlement une bijection de A sur B. L ensemble B est en bijection vec une prtie A de l ensemble dénombrble A, il est donc u plus dénombrble. Le cs A fini est une dpttion fcile de ce qui précède. 9. Pr exemple en fixnt une numérottion de A pr les entiers (k x k ) et en décidnt de prendre dns l clsse c l élément x k d indice k miniml. On évite insi l invoction de l xiome du choix... Ch. Suquet, Cours I.P.É. 21 23
Chpitre 1. Dénombrer et sommer 1.4 Rppels sur les séries Dns cette section nous rppelons sns démonstrtions les points essentiels de l théorie des séries numériques vue en deuxième nnée. Nous détillerons seulement l question de l convergence commuttive en rison de son rôle dns l théorie des fmilles sommbles. 1.4.1 Générlités Définition 1.42. Soit (u k ) k N une suite de nombres réels ou complexes. Pour tout n N, on ppelle somme prtielle de rng n le nombre S n := n u k. k= Si S n tend vers une limite finie S qund n tend vers +, on dit que l série de terme générl u k converge et pour somme S, ce que l on écrit S = + k= u k := lim S n. n + Dns ce cs, R n := S S n est ppelé reste de rng n de l série. Si S n n ps de limite finie (i.e. tend vers ou + ou n ps de limite du tout), on dit que l série diverge. Remrque 1.43. Pr un bus d écriture cournt, on désigne l série (convergente ou divergente) pr l nottion «+ k= u k», mis on ne peut fire intervenir cette expression dns des clculs que si elle représente vriment un nombre, i.e. si l série converge. Remrque 1.44. Si les u k sont complexes, posons x k := Re u k et y k := Im u k, S n := Re S n et S n := Im S n. L suite S n converge dns C vers S si et seulement si S n et S n convergent dns R vers respectivement S := Re S et S := Im S. On en déduit imméditement que l série de terme générl complexe u k = x k + iy k converge si et seulement si les séries de terme générl x k et y k convergent dns R et que dns ce cs + k= (x k + iy k ) = + k= x k + i Remrque 1.45. L définition 1.42 se générlise imméditement u cs où les u k sont éléments d un espce vectoriel normé E, l convergence dns E de S n vers le vecteur S signifint lim n + S S n =. Proposition 1.46. Si une série converge, son terme générl u n tend vers qund n tend vers l infini. Remrque 1.47. L réciproque de l proposition 1.46 est fusse. Un contre exemple bien connu est l série hrmonique de terme générl u k = 1/k pour k 1 (et u = ). + k= y k. 24 Ch. Suquet, Cours I.P.É. 21
1.4. Rppels sur les séries Remrque 1.48. L contrposée de l proposition 1.46 s énonce : si u n ne tend ps vers qund n tend vers l infini, lors l série diverge. On prle dns ce cs de divergence grossière de l série. Exemple 1.49 (séries géométriques). Soit q un nombre réel ou complexe. L série géométrique stndrd + k= qk converge si et seulement si q < 1. Dns ce cs, s somme est donnée pr + q k = 1 ( q < 1). 1 q k= Cette formule permet de clculer l somme de n importe quelle série géométrique convergente (donc de rison q vérifint q < 1). Il suffit de mettre en fcteur le premier terme. Si (u k ) k N est une suite géométrique de rison q (i.e. u k+1 = qu k pour tout k vec q ne dépendnt ps de k), vérifint q < 1, on pour tout j N, + k=j u k = + k=j + u j q k j = u j q l = l= u j 1 q. Théorème 1.5 (critère de Cuchy). L série à termes réels ou complexes + k= u k converge si et seulement si ε >, N N, n, m N, S n S m < ε. Ce théorème n est que l ppliction du critère de Cuchy à l suite des sommes prtielles S n = n k= u k. Il se générlise imméditement u cs où les termes u k sont des éléments d un espce vectoriel normé complet 1, en remplçnt S n S m < ε pr S n S m < ε. Corollire 1.51 (convergence bsolue). Si l série + k= u k converge, lors l série + k= u k converge ussi. On dit qu elle est bsolument convergente. Le résultt s étend imméditement ux séries à termes dns un espce vectoriel normé complet en remplçnt u k pr u k. On prle lors de convergence normle. Remrque 1.52. L réciproque du corollire 1.51 est fusse. Un contre exemple bien connu est l série lternée de terme générl u k = ( 1) k /k (k 1) qui converge lors que l série des vleurs bsolues est l série hrmonique qui diverge. 1.4.2 Séries à termes positifs Si tous les u k sont positifs, (S n ) n N est une suite croissnte cr pour tout n 1, S n S n 1 = u n. Il n y lors que deux cs possibles : ou bien S n une limite finie S dns R +, l série converge et pour somme S ; 1. C est le cs en prticulier pour les séries à vleurs dns R d. Un espce vectoriel normé complet est ppelé espce de Bnch. Ch. Suquet, Cours I.P.É. 21 25
Chpitre 1. Dénombrer et sommer ou bien S n tend vers + et l série diverge. L divergence d une série à termes positifs équivut donc à l convergence vers + de l suite de ses sommes prtielles. Il est commode dns ce cs de considérer que l série «converge dns R +» et que s somme vut +. Ainsi lorsque les u k sont tous positifs, l écriture + k= u k toujours un sens comme représentnt un élément S de R + : S étnt un réel positif si l série converge u sens de l définition 1.42, S = + sinon. Il importe de bien comprendre que ceci est prticulier ux séries à termes positifs. Une série à termes de signe quelconque 11 peut très bien diverger sns que l suite des sommes prtielles tende vers + ou. Un exemple évident est l série de terme générl u k = ( 1) k. Théorème 1.53 (comprison). On suppose qu il existe un k N tel que pour tout k k, u k v k. Alors ) l convergence 12 de + k= v k implique celle de + k= u k ; b) l divergence de + k= u k implique celle de + k= v k. Prmi les pplictions du théorème de comprison figure l comprison à une série géométrique qui donné nissnce ux règles dites de D Alembert et de Cuchy (bsées respectivement sur l étude du comportement symptotique de u n+1 /u n et de u 1/n n ). Ces règles n ont d utre utilité que de résoudre des exercices d hoc et on peut fcilement s en psser. Théorème 1.54 (règle des équivlents). On suppose que u k et v k sont équivlents 13 qund n tend vers l infini et qu à prtir d un rng k, v k. Alors les séries + k= u k et + k= v k sont de même nture (toutes deux convergentes ou toutes deux divergentes). Attention, l hypothèse d équivlence de u k et v k n implique ps à elle seule que les deux séries soient de même nture si le signe de v k n est ps constnt à prtir d un certin rng. Comme contre exemple on peut proposer u k = ( 1) k k 1/2 et v k = u k +1/k (exercice). Théorème 1.55 (comprison série-intégrle). Soit f continue sur [k, + [, décroissnte et positive sur cet intervlle. L série + k=k f(k) converge si et seulement si n k f(t) dt une limite finie qund n tend vers +. L démonstrtion repose sur l encdrement n > k, n 1 k=k f(k + 1) n k f(t) dt n 1 k=k f(k) illustré pr l figure 1.4. Cet encdrement son intérêt propre pour contrôler le reste d une série à l ide d une intégrle générlisée (ou vice vers). En ppliqunt le théorème 1.55 vec f(t) = t α, α > et k = 1, on obtient l crctéristion de l convergence des séries de Riemnn. 11. Plus précisément une série dont l suite des termes présente une infinité de chngements de signe. 12. L convergence et l divergence dns cet énoncé sont entendues u sens de l définition 1.42. 13. Ce qui signifie que l on peut écrire u k = c k v k vec lim k + c k = 1. 26 Ch. Suquet, Cours I.P.É. 21
1.4. Rppels sur les séries y 1 f(k) f(k + 1) k k + 1 t Fig. 1.4 Comprison série-intégrle : f(k + 1) k+1 f(t) dt f(k) k Corollire 1.56 (séries de Riemnn). L série + k=1 1 k α est { convergente pour α > 1, divergente pour < α 1. L série est ussi divergente pour α, puisqu lors son terme générl ne tend ps vers. Corollire 1.57 (séries de Bertrnd). L série + k=2 1 k(ln k) β est { convergente pour β > 1, divergente pour < β 1. Remrque 1.58. Pour α 1 (ou pour α = 1 et β ), l nture de l série de Bertrnd + k=2 k α (ln k) β s obtient directement pr comprison vec une série de Riemnn. 1.4.3 Séries à termes de signe non constnt Après voir vu que l convergence de + k= u k implique celle de + k= u k, on peut se demnder s il existe des séries qui convergent sns converger bsolument. Remrquons d bord que si le signe de u k est constnt à prtir d un certin rng k, l étude de l convergence de + k= u k se rmène à celle d une série à termes positifs. En effet, + k= u k et + k=k u k sont de même nture et si u k pour k k, il suffit de considérer + k=k ( u k ). Ainsi pour une série à termes de signe constnt à prtir d un certin rng, l convergence équivut à l convergence bsolue et l divergence ne peut se produire que si S n tend vers + ou vers. Les seules séries susceptibles d être convergentes sns l être bsolument sont donc celles dont le terme générl chnge de signe une infinité de fois. Pr exemple, l série + k=1 ( 1)k /k converge mis ps bsolument. C est une ppliction du théorème des séries lternées. Ch. Suquet, Cours I.P.É. 21 27
Chpitre 1. Dénombrer et sommer Théorème 1.59 (des séries lternées). Soit (u k ) k N une suite lternée (i.e. pour tout k, u k et u k+1 sont de signes contrires) telle que u k décroisse et tende vers. Alors ) l série + k= u k converge, b) pour tout n N, les sommes prtielles consécutives S n et S n+1 encdrent 14 l somme S et le reste R n = + k=n+1 u k vérifie R n u n+1. Exemple 1.6. Pour < α 1, l série + k=1 ( 1)k k α converge mis ps bsolument. Pour α > 1 elle est bsolument convergente. Exemple 1.61. L série + k=1 ( 1)k / ln k converge mis ps bsolument. Remrque 1.62. Même si une série lternée est bsolument convergente, le b) du théorème reste intéressnt pour le clcul numérique de l somme S. 1.4.4 Opértions sur les séries L somme des séries de terme générl u k et v k est l série de terme générl (u k + v k ). Le produit de l série de terme générl u k pr l constnte est l série de terme générl u k. Le produit de deux séries ser étudié plus trd à l ide des fmilles sommbles. Proposition 1.63. Les ffirmtions suivntes sont vérifiées pour des séries à termes réels ou complexes ou dns un espce vectoriel normé. ) L somme de deux séries convergentes + k= u k et + k= v k est une série convergente et + k= (u k + v k ) = + k= u k + b) Le produit de l série convergente + k= u k pr l constnte est une série convergente et + k= u k = c) L somme d une série convergente et d une série divergente est une série divergente. d) L somme de deux séries divergentes peut être convergente ou divergente. Dns une somme d un nombre fini de termes, les propriétés de commuttivité et d ssocitivité de l ddition permettent de chnger l ordre des termes sns chnger l vleur de l somme, de fire des groupements de termes sns chnger l vleur de l somme. 14. Attention, une fois sur deux on ur S n+1 S n. + k= u k. + k= v k. 28 Ch. Suquet, Cours I.P.É. 21
1.4. Rppels sur les séries Que deviennent ces propriétés pour les séries considérées comme sommes d une infinité de termes? En gros l réponse est : si l série est bsolument convergente, tout se psse bien, sinon on peut voir des situtions très pthologiques. Le seul cs où l on n it ps besoin de convergence bsolue pour retrouver une sitution conforme ux propriétés des sommes d un nombre fini de termes est celui de l sommtion pr pquets de tille finie fixe. Proposition 1.64 (sommtion pr pquets de tille finie fixe). Soit (u n ) n N une suite tendnt vers à l infini. Fixons un entier p 2 et définissons les «pquets de p termes consécutifs» p 1 v j = u jp+i, j N. i= Alors les séries + k= u k et + j= v j sont de même nture et ont même somme lorsqu elles convergent. Remrque 1.65. Sns l hypothèse de convergence vers de l suite (u n ), le résultt devient grossièrement fux, contre exemple u n = ( 1) n. Remrque 1.66. Si + k= u k est bsolument convergente, l série des pquets + j= v j l est ussi. L réciproque est fusse, comme on peut le voir en groupnt deux pr deux les termes de l série + k= ( 1)k /(k + 1), obtennt insi l série de terme générl positif v j = (2j + 1) 1 (2j + 2) 2 équivlent à 4j 2. Définition 1.67 (convergence commuttive). L série + k= u k est dite commuttivement convergente et de somme S si pour toute bijection f : N N l série + k= u f(k) converge et pour somme S. Dns ce cs nous pouvons utiliser l nottion S = k N u k u lieu de S = + k= u k, puisque l somme de l série ne dépend ps de l ordre dns lequel on effectue l sommtion. L écriture vec indextion pr «k N» ne présuppose ucun ordre d écriture des termes 15. Théorème 1.68. L convergence bsolue d une série à termes réels ou complexes, implique s convergence commuttive. Nous llons démontrer le théorème en exminnt successivement les cs des séries à termes positifs, réels et complexes. 15. Pr nlogie vec l écriture i I u i, où I est un ensemble fini d indices. Dns ce cs le résultt de l ddition des u i pour i I ne dépend ps de l ordre des termes et d illeurs l ensemble I n nul besoin ici d être ordonné. Ch. Suquet, Cours I.P.É. 21 29
Chpitre 1. Dénombrer et sommer Preuve du th. 1.68, cs d une série à termes positifs. Nous tritons d bord le cs d une série à termes positifs pour lquelle l convergence bsolue se réduit à l convergence et signifie que l suite croissnte des sommes prtielles S n une limite finie S dns R +. Soit f une bijection N N. Définissons les deux suites d entiers (p n ) n N et (q n ) n N comme suit. Pour p n nous prenons le plus petit entier p tel que {f(k); k p} recouvre {,..., n}. L existence de tels p et donc de p n découle clirement de l surjectivité de f. Pour q n on prend mx{f(k); k p n }. Autrement dit p n sert à recouvrir {,..., n} de l mnière l plus économique pr les premiers termes de l suite des f(k) et q n sert à «boucher les trous» de l suite d entiers insi formée. On insi n N, {,..., n} {f(k); k p n } {,..., q n }. (1.15) On clirement n p n et n q n donc p n et q n tendent vers l infini vec n. De plus ces deux suites sont croissntes de pr leur construction. Posons S n := n u k, T n := k= n u f(k). k= En rison de l positivité des u k et de (1.15), nous disposons de l encdrement n N, S n T pn S qn. (1.16) Si S n converge vers S, l sous-suite (S qn ) converge ussi vers S et (1.16) implique lors l convergence de (T pn ) vers S. En rison de l positivité des u k, l suite (T n ) est croissnte. Nous venons de voir qu elle une sous-suite qui converge vers S, c est donc toute l suite (T n ) qui converge vers S. Nous venons d étblir que + k= u f(k) converge et pour somme S = + k= u k. Comme l bijection f est quelconque, ceci chève l preuve du théorème 1.68 dns le cs d une série à termes positifs. Remrque 1.69. Pour étblir (1.16), nous n vons ps utilisé l hypothèse de convergence de l série de terme générl u k, mis seulement l positivité des u k. Pr conséquent (1.16) reste vlble si l série à termes positifs + k= u k diverge. Dns ce cs S n tend vers +, donc ussi T pn et l suite croissnte (T n ) ynt une sous-suite tendnt vers +, c est toute l suite (T n ) qui tend vers l infini. Ainsi on + k= u f(k) = + = + k= u k. Pour l commodité de référence et en rison du rôle essentiel joué pr les séries à termes positifs dns ce cours, nous rssemblons dns l énoncé suivnt les résultts obtenus dns l preuve du théorème 1.68 (cs u k ) et dns l remrque 1.69. Proposition 1.7. Si (u k ) k N est une suite de réels positifs, on pour toute bijection f : N N, + k= u k = + k= u f(k), cette églité ynt lieu dns R +. Ainsi si les u k sont positifs, l nottion k N u k est toujours légitime et représente l somme S R + de l série. 3 Ch. Suquet, Cours I.P.É. 21
1.4. Rppels sur les séries Dns l preuve du théorème 1.68, le cs d une série à termes réels de signe quelconque v se rmener à celui d une série à termes positifs en utilisnt l décomposition d un réel en prtie positive et prtie négtive. Ceci requiert une digression prélble (de l définition 1.71 à l remrque 1.74). Définition 1.71 (prties positive et négtive). Pour tout x réel, s prtie positive notée x + et s prtie négtive notée x sont les réels positifs définis pr x + := mx(, x), x := mx(, x). On lors pour tout x réel x = x + x, (1.17) x = x + + x. (1.18) Pr exemple si x = 3,12, x + = 3,12 et x =, si x = 2,3, x + = et x = 2,3. Il importe de bien noter que l prtie négtive d un réel est un nombre positif ou nul. Voyons d bord comment intervient cette décomposition pour une série bsolument convergente. Lemme 1.72. Si + k= u k est une série à termes réels bsolument convergente et de somme S, les séries à termes positifs + k= u+ k et + k= u k sont convergentes et on + k= u k = + k= + (u + k u k ) = + u + k u k. (1.19) Preuve. Pr (1.18), on u + k u k et u k u k. Les séries de terme générl u + k et u k sont donc convergentes pr le théorème de comprison. L première églité dns (1.19) résulte lors de (1.17) ppliquée à x = u k. L deuxième églité s obtient pr l proposition 1.63 ) et b). Remrque 1.73. L réciproque est vrie : si les séries à termes positifs + k= u+ k et + k= u k sont convergentes, l série + k= u k est bsolument convergente et on (1.19) grâce à l proposition 1.63. Ceci montre que l on ne peut ps se psser de l hypothèse de convergence bsolue dns le lemme 1.72. Il est d utre prt fcile d exhiber un contre exemple : l série de terme générl u k = ( 1) k /k. Remrque 1.74. L églité «+ k= u+ k = ( + k= u k) +» est grossièrement fusse! Elle n est même ps vrie pour des sommes finies. Comprez (+b) + et + +b + pour = 1 et b = 2 pour vous en convincre. Preuve du th. 1.68 dns le cs d une série à termes réels. Soit + k= u k une série bsolument convergente à termes réels et f une bijection quelconque N N. On utilise l décomposition u f(k) = u + f(k) u f(k). Pr le lemme 1.72, l convergence bsolue de l série de terme générl u k implique l convergence des séries à termes générux positifs u + k et u k. L preuve du théorème 1.68 dns le cs des termes positifs nous fournit lors l k= k= Ch. Suquet, Cours I.P.É. 21 31
Chpitre 1. Dénombrer et sommer convergence des séries + k= u+ f(k) et + k= u f(k) et l églité de leurs sommes vec + k= u+ k et + k= u k respectivement. Pr l remrque 1.73, on en déduit l convergence bsolue de + k= u f(k). Compte-tenu du lemme 1.72, on de plus + k= u f(k) = + + u + f(k) + u f(k) = + u + k k= k= k= k= u k + = + (u + k u k ) = u k. k= k= Preuve du th. 1.68 dns le cs d une série à termes complexes. Pour des u k complexes, notons x k := Re u k et y k := Im u k. Grâce ux inéglités x k u k et y k u k, les séries de terme générl réel x k et y k héritent de l convergence bsolue de l série de terme générl complexe u k. On conclut lors en combinnt l preuve du th. 1.68 dns le cs réel et l remrque 1.44. Remrque 1.75. L rgument utilisé ci-dessus dns le cs complexe se générlise ux séries à vleurs dns un espce vectoriel normé E de dimension finie, disons pour simplifier E = R d. En effet sur cet espce toutes les normes sont équivlentes et on peut donc choisir l norme donnée pr x = mx 1 i d x i pour x = (x 1,..., x d ). L convergence d une suite dns (E, ) équivut à l convergence composnte pr composnte et l convergence de + k= u k implique l convergence bsolue des d séries de terme générl u k,i, en posnt u k = (u k,1,..., u k,d ). L dpttion de l preuve ci-dessus est lors immédite. Pr contre si E est de dimension infinie, ce risonnement n est plus vlble. Théorème 1.76. L convergence commuttive d une série à termes réels ou complexes, implique s convergence bsolue. Preuve. Il est clir qu il suffit de triter le cs des séries à termes réels. Nous llons démontrer l contrposée de l énoncé, c est-à-dire que l négtion de l conclusion implique l négtion de l hypothèse. Dns ce but nous supposons que l série de terme générl u k converge vers le réel S mis ps bsolument, utrement dit que : + k= u k = S R et + k= u k = +. (1.2) Nous llons construire une bijection f : N N telle que + k= u f(k) ne converge ps vers S. On commence pr noter que (1.2) implique que + u + k = + et + k= k= u k = +. (1.21) En effet si ces deux sommes sont finies, l série + k= u k est bsolument convergente pr l remrque 1.73. Si l une est finie et l utre infinie, l série + k= u k diverge pr l proposition 1.63 b) et c). 32 Ch. Suquet, Cours I.P.É. 21
1.4. Rppels sur les séries Nous llons montrer que l on peut construire une bijection f pour lquelle les sommes prtielles n k= u f(k) oscillent indéfiniment entre 1 et 1 et donc n ont ps de limite. L écriture explicite de l définition de f étnt ssez lourde, nous nous contenterons de donner l idée de s construction. Le point clé est le lemme suivnt. Lemme 1.77. Soit v = (v k ) k N une suite de réels positifs telle que + k= v k = +. Pour tout intervlle borné I de R +, définissons T (I, v) := vec l convention T (, v) :=. On lors k N I i N, x R +,!j = j(i, x, v) N; T ([i, j[, v) x < T ([i, j], v). (1.22) Preuve du lemme. Notons t i,j := T ([i, j[, v). On remrque que pour tout i N fixé, l suite (t i,j ) j i est croissnte à cuse de l positivité des v k et tend vers + qund j tend vers +. Ce dernier point résulte de l hypothèse + k= v k = + et du fit que l on ne chnge ps l divergence de cette série en supprimnt ses i premiers termes. De plus on t i,i = cr [i, i[=. Il est lors clir que l on obtient (1.22) vec j := mx{l i; t i,l x}. Prtgeons mintennt N en les deux sous-ensembles complémentires : v k, A + := {l N; u l }, A := {l N; u l < }. Il résulte imméditement de (1.21) que ces deux ensembles sont infinis (donc dénombrbles comme prties infinies de N). Définissons lors les suites v = (v k ) k N et w = (w k ) k N en prennt pour v k (resp. w k ) le terme de rng k dns l numérottion croissnte des u l indexés pr A + (resp. A ). En ppliqunt le lemme 1.77 lterntivement vec les suites v et w, on peut construire f pr récurrence de fçon à ce que les sommes prtielles T n = n k= u f(k) se trouvent à guche de 1 pour une infinité de n et à droite de +1 pour une infinité de n. Voici le début de l construction. On pplique d bord le lemme vec i =, x = 1 et v. On obtient lors T n1 1 pour n 1 = j(, 1, v) donné pr(1.22). Ensuite on revient en rrière en ppliqunt le lemme vec w, i = et x = 1+T n1. Pour n 2 = n 1 +j(, x, w), on lors T n2 < 1. Pour l troisième étpe, on utilise le lemme vec v, i = j(, 1, v)+1, x = T n2 + 1 et pour n 3 = n 2 + j(i, x, v) on obtient T n3 1. Et insi de suite... On peut dpter l démonstrtion ci-dessus pour construire d utres bijections f de fçon à fire osciller les sommes prtielles entre et b fixés, ou pour les fire converger vers n importe quel réel fixé 16, pour les fire tendre vers +, vers, etc. Pour conclure cette section, retenons que pour les séries à termes réels ou complexes, convergence commuttive et convergence bsolue sont équivlentes. 16. Il fudr utiliser lors l convergence vers de u n, ce dont nous n vons ps eu besoin ci-dessus. Ch. Suquet, Cours I.P.É. 21 33
Chpitre 1. Dénombrer et sommer 1.5 Fmilles sommbles Dns cette section, nous llons générliser l notion de série en essynt de donner un sens à une expression de l forme i I u i, où I est un ensemble infini 17. Dns le cdre de ce cours, nous n urons besoin que du cs où les u i sont réels ou complexes. Nénmoins, pour fciliter l utilistion dns d utres brnches des mthémtiques (pr exemple nlyse complexe, séries de Fourier, nlyse fonctionnelle...), nous nous situerons d emblée dns le cs où les u i sont des éléments d un espce vectoriel normé E. Le lecteur que cel gênerit pourr fcilement dpter les énoncés u cs des u i réels ou complexes en remplçnt les normes pr des vleurs bsolues ou des modules. Cette simplifiction des énoncés n pporte d illeurs ps de simplifiction notble des démonstrtions. Prtons de l définition de l convergence d une série de vecteurs de terme générl u k dns un espce vectoriel normé E. Ici l ensemble d indextion est N. On dit que cette série converge et pour somme le vecteur S de E si l suite des sommes prtielles S n := u + u 1 + + u n converge vers S, utrement dit si S n S tend vers qund n tend vers +. Ceci s écrit encore : ε >, n N, n n, S n S < ε. (1.23) Si on veut générliser ceci à une fmille de vecteurs (u i ) i I où I est un ensemble infini quelconque, on se heurte imméditement à une difficulté, c est qu une écriture comme «i i», n en générl ps de sens dns I qui n ucune rison d être muni d une reltion d ordre totl. Essyons lors de trduire l idée exprimée pr (1.23) sns fire ppel à l structure d ordre de N. On remrque pour cel que S n rélise une pproximtion de S pr l somme d un nombre fini de termes de l fmille (u k ) k N vec une erreur S n S inférieure à ε. Cette pproximtion peut être rélisée pr une somme finie indexée pr n importe quel ensemble K n := {, 1, 2,..., n} d entiers consécutifs entre et n pourvu que n n. Pour se débrrsser de l reltion d ordre intervennt dns cette dernière écriture on l reformule en K n K n. Réécrivons mintennt (1.23) à l ide des ensembles emboîtés K n. ε >, K n = {,..., n }, K n K n, u k S < ε. (1.24) k K n Au risque d insister lourdement, notons que dns l écriture, «K n K n», K n désigne non ps n importe quelle prtie finie de N, mis un ensemble fini de l forme {, 1, 2,..., n}. Avons nous réussi insi à expurger (1.23) de l reltion d ordre sur N? En fit non, nous vons seulement réussi à l ccher dns l définition des ensembles K n d entiers consécutifs entre et n. Si on veut vriment générliser à un ensemble d indextion I quelconque, on est donc condmné à renoncer à cette structure prticulière des K n et à ne retenir que leur finitude. On est insi mené à introduire une nouvelle 17. L exposé présenté ici est essentiellement une dpttion du chpitre XIV Séries dns les espces vectoriels normés de l ouvrge de L. Schwrtz,Topologie générle et nlyse fonctionnelle, Hermnn, Pris 197. 34 Ch. Suquet, Cours I.P.É. 21
1.5. Fmilles sommbles notion de convergence pour l série de terme générl u k : ε >, J fini N, K fini tel que J K N, u k S < ε. (1.25) Pourquoi vons nous pris l précution de qulifier cette convergence de nouvelle? Prce que s il est clir que (1.25) implique (1.24) et donc (1.23), rien ne nous permet d ffirmer que l réciproque soit vrie. Nous verrons d illeurs ci-dessous que cette réciproque est fusse pour les séries qui ne sont ps commuttivement convergentes. Après ce briefing, lnçons nous résolument dns l venture de l sommtion d une fmille (u i ) i I indexée pr un ensemble quelconque, les u i étnt des éléments d un espce vectoriel normé E. Commençons pr une nottion. Si K est un sous-ensemble fini de I, on pose : S K := i K u i. Cette définition est cohérente puisque dns un espce vectoriel E l somme d un nombre fini d éléments de E est encore un élément de E et ne dépend ps de l ordre d écriture des termes. Cette nottion n est ps contrdictoire vec celle utilisée pour les sommes prtielles S n d une série de terme générl u i, i N, en considérnt que S n est une brévition de S {,...,n} qu il ne fut ps confondre vec S {n} = u n. Dns le cs prticulier où K =, on fit l convention S := (vecteur nul de E). Dns tout ce qui suit, les lettres mjuscules J, K désigneront toujours des prties finies de I et nous omettrons prfois d écrire K I si le contexte lève toute mbiguïté. Définition 1.78 (fmille sommble). Soit E un espce vectoriel normé, I un ensemble d indices et (u i ) i I une fmille d éléments de E. On dit que cette fmille est sommble de somme S E si ε >, J fini I, K fini J, S K S < ε. (1.26) k K On écrir lors S = i I u i. Insistons sur le fit que cette définition ne suppose ucune structure d ordre sur l ensemble d indices I et donc ucun ordre privilégié d écriture des termes. Si I est fini, toute fmille (u i ) i I est trivilement sommble, il suffit de prendre S = S I et J = I dns (1.26) pour voir S K S =. L définition 1.78 n donc d intérêt que pour I infini. Nous verrons bientôt qu en fit, on peut se rmener à un I u plus dénombrble (prop. 1.85). Remrque 1.79. Si {u i, i I} est sommble, s somme S est unique, c est-à-dire que si les vecteurs S et S vérifient tous les deux (1.26), lors S = S. Bien sûr, l ensemble fini «J» ssocié à S et à ε pr (1.26) n ucune rison d être le même que pour S, nous le noterons donc plutôt J. Pour tout ε >, l ensemble fini K = J J contient à l fois J et J, donc S S K ε et S S K ε. Pr inéglité tringulire, S S 2ε. Dns cette dernière inéglité, K qui dépendit de ε dispru et le premier membre ne dépend ps de ε. L inéglité étnt vrie pour tout ε >, S S = et S = S. Ch. Suquet, Cours I.P.É. 21 35
Chpitre 1. Dénombrer et sommer L sommbilité est préservée pr combinison linéire. L énoncé précis est le suivnt. Proposition 1.8 (sommbilité et combinison linéire). Soient (u i ) i I et (u i) i I deux fmilles sommbles dns le même espce vectoriel normé E, ynt même ensemble d indextion I. Notons S et S les sommes respectives. Alors pour tous sclires et b, l fmille (u i + bu i) i I est sommble dns E, de somme S + bs. Preuve. Il est clir qu il suffit de triter les deux cs prticuliers de (u i + u i) i I et de (u i ) i I. Nous détillons seulement le premier, lissnt l utre u lecteur. Pr hypothèse de sommbilité des fmilles (u i ) i I et (u i) i I, on pour tout ε >, deux prties finies J et J de I telles que pour tous K, K finis tels que J K I et J K I, S S K < ε/2 et S S K < ε/2. Ces deux inéglités sont vries en prticulier pour K = K = L où L est n importe quelle prtie finie de I contennt J J. Pr inéglité tringulire, on lors (S + S ) (S L + S L ) < ε. Pr les propriétés de l ddition dns E et l finitude de L, on S L + S L = i L u i + i L u i = i L(u i + u i). On donc bien vérifié que (u i + u i) i I est sommble et pour somme S + S. L sommbilité est préservée pr permuttion sur les indices. Proposition 1.81 (invrince pr permuttion). Soit (u i ) i I une fmille sommble de somme S. Alors pour toute bijection ϕ : I I, l fmille (u ϕ(i) ) i I est sommble de somme S. Preuve. Il s git de montrer que (v i ) i I est sommble de même somme S que (u i ) i I, les v i étnt définis pr v i := u ϕ(i). L hypothèse de sommbilité de (u i ) i I s écrit ε >, J fini I, K fini J, S K S < ε (1.27) Posons J := ϕ 1 (J) = {ϕ 1 (i); i J}. L ensemble J est fini cr en bijection vec l ensemble fini J pr ϕ 1. Pour tout K fini contennt J, l ensemble fini ϕ(k ) contient ϕ(j ) et ce dernier ensemble est égl à J. On donc en ppliqunt (1.27) vec ϕ(k ) u lieu de K, S ϕ(k ) S < ε et ceci est vri pour tout K fini contennt J. D utre prt S ϕ(k ) = l ϕ(k ) u l = i K u ϕ(i) = i K v i. Nous vons donc montré que ε >, J fini I, K fini J, v i S < ε, i K utrement dit que (v i ) i I est sommble de somme S. 36 Ch. Suquet, Cours I.P.É. 21
1.5. Fmilles sommbles Remrque 1.82 (sommbilité d une série). Plçons nous un instnt dns le cs prticulier I = N. Nous svions déjà, cf. l impliction (1.25) (1.23) vue en introduction, que l sommbilité de (u k ) k N implique l convergence de l série + k= u k. L proposition 1.81 nous pprend en plus que cette convergence est nécessirement commuttive. Dns le cs où les u k sont réels ou complexes, on peut donc dire que l sommbilité de (u k ) k N implique l convergence commuttive et bsolue de l série + k= u k, cf. théorème 1.76. Ainsi comme nous l vions nnoncé en introduction, l impliction «(1.23) (1.25)» est fusse. Pr exemple l série de terme générl u k = ( 1) k /(k + 1) est convergente, mis l fmille (u k ) k N n est ps sommble. Il est fcile de donner une crctéristion de l sommbilité pour les fmilles de réels positifs. Proposition 1.83. Soit (u i ) i I une fmille d éléments de R +. ) Si (u i ) i I est telle que M := sup K fini I S K < +, (1.28) lors elle est sommble de somme M. b) Réciproquement, si (u i ) i I est sommble de somme S, on donc ce sup est fini. S = sup S K, (1.29) K fini I Preuve du ). Soit ε >. Comme M est fini, M ε est strictement inférieur à M. Pr minimlité du supremum M prmi tous les mjornts de l ensemble {S K ; K fini I}, il existe une prtie finie J de I telle que M ε < S J M. De plus pour toute prtie finie K de I, contennt J, M ε < S J S K M. (1.3) En effet, S K S J = S K\J est une somme de réels positifs, donc positive, ce qui justifie l deuxième inéglité dns (1.3). L troisième découle de l définition de M. Comme (1.3) implique M S K < ε, nous vons insi étbli que {u i, i I} est sommble et de somme M. Preuve du b). Supposons mintennt que (u i ) i I est sommble dns R +, de somme S. Notons M le supremum défini pr (1.29), qu il soit fini ou infini. On commence pr remrquer que pour toute prtie finie J de I, on l églité suivnte dns R + : M := sup S L = sup S K. (1.31) L fini I K fini, J K I Ch. Suquet, Cours I.P.É. 21 37
Chpitre 1. Dénombrer et sommer En effet l positivité des u i et l inclusion de L fini dns l ensemble fini L J contennt J, nous donnent pour tout L fini l inéglité S L S L J. On en déduit l inéglité des suprem M sup K fini, J K I S K. L inéglité inverse étnt évidente, (1.31) est vérifiée. Soit ε > quelconque. Il existe une prtie finie J = J(ε) de I telle que pour tout K fini vérifint J K I, S K ]S ε, S + ε[. Ceci implique sup S K [S ε, S + ε] K fini, J K I et compte-tenu de (1.31) ppliqué vec J = J(ε), M [S ε, S + ε]. Ceci nous montre déjà que M est fini. On de plus S M ε pour tout ε >, d où M = S. Remrque 1.84. Il résulte de l proposition 1.83 qu une fmille de réels positifs u i est non sommble si et seulement si le supremum M des sommes S K pour K prtie finie de I vut +. L sitution est nlogue à celle des séries à termes positifs qui ne peuvent diverger que si l suite des sommes prtielles tend vers +. On pourr donc toujours donner un sens à l expression i I u i, considérée comme élément de R +, en posnt u i := i I sup S K = K fini,k I { S R +, si (u i ) i I est sommble de somme S, +, sinon. (1.32) Cette sitution est prticulière ux fmilles à termes positifs et c est le seul cs où nous donnerons un sens à i I u i sns que l fmille soit forcément sommble. Proposition 1.85 (sommbilité et dénombrbilité). Si (u i ) i I est sommble, l ensemble d indices I := {i I; u i } est u plus dénombrble. Preuve. Pour chque n N, ppliquons (1.26) vec ε = 1/n et choisissons l un 18 des ensembles finis J donnés pr (1.26), que nous noterons J n. Posons H := J n N n. L ensemble H est u plus dénombrble comme réunion dénombrble d ensembles u plus dénombrbles (prop. 1.4). Si H = I, lors I qui est inclus dns H est donc u plus dénombrble. En dehors de ce cs trivil, I \ H n est ps vide. Soit i un élément quelconque de I \ H. En ppliqunt (1.26) vec ε = 1/n, J = J n et chcun des deux ensembles finis K = J n, K = J n {i }, on obtient les deux inéglités : S Jn S 1 n et u i + S Jn S 1 n, 18. L propriété (1.26) nous ssure qu il existe u moins un J pour ε donné, mis ne dit rien sur l unicité. 38 Ch. Suquet, Cours I.P.É. 21
1.5. Fmilles sommbles vries pour tout n N. En écrivnt u i = (u i + S Jn S) + (S S Jn ), l inéglité tringulire nous donne n 1, u i 2 n. Fisnt tendre n vers l infini (noter que i est fixé et ne dépend ps de n), on en déduit u i =, d où u i =. Ce risonnement étnt vlble pour n importe quel i I \ H, on en déduit que I est inclus dns H. Pr conséquent, I est u plus dénombrble. Nous llons voir mintennt que pour I dénombrble, sommbilité de (u i ) i I et convergence commuttive de l série ssociée vi une numérottion de I sont équivlentes. Théorème 1.86. Si I est dénombrble, les propriétés suivntes sont équivlentes : ) (u i ) i I est sommble de somme S ; b) pour toute bijection f : N I, l série + k= u f(k) converge et pour somme S. Avnt de démontrer ce théorème, remrquons que l propriété b) implique que l série de terme générl v k := u f(k) est commuttivement convergente et ceci pour tout choix d une bijection f : N I. En effet, fixons une telle bijection et donc l suite (v k ) k N correspondnte. Soit σ une bijection quelconque de N sur N. On pour tout k N, v σ(k) = u f(σ(k)) = u g(k), où g := f σ est une bijection de N sur I. Pr b), l série + k= u g(k) converge et pour somme S. Or cette série est exctement + k= v σ(k). Pr rbitrrité de l bijection σ on en déduit que + k= v k est commuttivement convergente. Réciproquement, supposons qu il existe u moins une bijection h : N I telle que l série + k= u h(k) converge commuttivement et it pour somme S. Alors (u i ) i I vérifie l propriété b). En effet toute bijection f : N I peut s écrire f = (h h 1 ) f = h (h 1 f) = h σ, où σ := h 1 f est une bijection de N sur N. Alors pour tout k N, u f(k) = u h(σ(k)) = v σ(k), où l on noté v k := u h(k) le terme générl de l série + k= u h(k). L série + k= v k étnt commuttivement convergente de somme S, on en déduit que l série de terme générl u f(k) = v σ(k) converge et pour somme S. Preuve de ) b). Avec les J n choisis comme dns l preuve de l proposition 1.85, on pour toute prtie finie K de I contennt J n, S K S 1/n. Puisque f est une bijection de N sur I et J n une prtie finie de I, il existe pour chque n N un entier k (n) tel que f ( {, 1, 2,..., k (n)} ) J n. Il suffit de prendre pour cel, k (n) := mx{f 1 (i); i J n }. Alors pour tout entier l k (n), K := f ( {, 1, 2,..., l} ) est une prtie finie de I, contennt J n et donc S S K 1/n. Comme S K = l k= u f(k), nous venons insi d étblir que : n N l, k (n), l k (n), u f(k) S 1 n, ce qui équivut à l convergence vers S de l série de terme générl u f(k) (c est juste ce que l on obtient en discrétisnt le «ε >» en le remplçnt pr ε = 1/n dns l définition de cette convergence). k= Ch. Suquet, Cours I.P.É. 21 39
Chpitre 1. Dénombrer et sommer Preuve de b) ). Nous llons prouver cette impliction en démontrnt s contrposée : non ) non b). L négtion de ) s écrit ε >, J prtie finie de I, K fini, J K I et S S K > ε. (1.33) Fixons une première bijection ϕ : N I. Posons k := et J := {ϕ()}. Pr (1.33) il existe une prtie finie K de I, contennt J et telle que S S K > ε. On peut mintennt choisir un entier k 1 > k tel que J 1 := ϕ ( {, 1,..., k 1 } ) contienne strictement K, il suffit pour cel de prendre k 1 = 1 + mx{ϕ 1 (i); i K }. Une nouvelle invoction de (1.33) nous fournit une prtie finie K 1 de I, contennt J 1 et telle que S S K1 > ε. Nous venons insi d morcer une récurrence qui bsée sur l utilistion itérée de (1.33), nous permet de construire une suite strictement croissnte d entiers (k n ), deux suites (J n ) et (K n ) de prties finies de I, vérifint : n N, ϕ ( {, 1,..., k n } ) = J n K n J n+1 et S S Kn > ε. (1.34) Pr cette construction, l suite (K n ) est strictement croissnte pour l inclusion. L réunion de cette suite est exctement I. En effet elle est évidemment incluse dns I puisque chque K n est une prtie de I. Dns l utre sens, si i est un élément quelconque de I, ϕ 1 (i) est un entier qui est mjoré pr k n pour n ssez grnd (l suite strictement croissnte d entiers (k n ) tend vers l infini). Pr construction de J n, l inéglité ϕ 1 (i) k n implique l pprtennce de i à J n, donc ussi à K n. Ainsi un élément quelconque i de I pprtient toujours à u moins un K n, donc I K n et finlement I = K n. n N n N Posnt mintennt I := K et n N, I n := K n \ K n 1, il est clir qu ucun des I n n est vide (stricte croissnce de (K n )), qu ils sont deux à deux disjoints (pour l même rison) et que leur réunion est I. L fmille {I n ; n N} constitue donc une prtition de I en sous-ensembles finis. Notons mintennt n N, m n := crd K n 1. Comme (K n ) est strictement croissnte pour l inclusion, l suite d entiers (m n ) est strictement croissnte. On obtient lors une prtition {A n ; n N} de N en posnt : A := {,..., m }, et n N, A n := {m n 1 + 1,..., m n }. Les A n sont finis, crd A = m + 1 = crd K = crd I et pour n 1, crd A n = m n m n 1 = crd K n crd K n 1 = crd I n. Dire qu A n et I n ont même crdinl c est dire précisément qu il existe une bijection f n : A n I n. En «recollnt» ces bijections f n entre ensembles finis, on construit une ppliction f : N I : tout k N pprtient à un unique A n (puisque les A n prtitionnent N) et on pose lors f(k) := f n (k), (k A n ). 4 Ch. Suquet, Cours I.P.É. 21
1.5. Fmilles sommbles Vérifions que f insi définie est une bijection. Tout i I pprtient à un I n (puisque les I n prtitionnent I). Il lors pour ntécédent pr f l entier fn 1 (i) A n. Ceci montre que chque i I u moins un ntécédent pr f, donc que f est surjective. Pour vérifier l injectivité, soient k et l deux entiers distincts. Ou bien ils sont dns le même A n et lors f(k) = f n (k) f n (l) = f(l) pr injectivité de f n. Ou bien k A n et l A n vec n n. Alors f(k) I n et f(l) I n et comme I n et I n sont disjoints, f(k) et f(l) sont forcément distincts. Nous vons finlement construit une suite strictement croissnte d entiers m n (donc tendnt vers l infini) et une bijection f : N I telles que Au vu de (1.34), nous vons insi n N, f ( {,..., m n } ) = K n. n N, m n u f(k) S > ε, k= ce qui interdit l convergence vers S de l série de terme générl u f(k). L existence d une bijection f pour lquelle l série de terme générl u f(k) ne converge ps vers S est précisément l propriété «non b)». Le prochin théorème est l nlogue du critère de Cuchy pour les fmilles sommbles. Il est surtout importnt pr ses corollires. Il s pplique vec E espce vectoriel normé complet donc en prticulier vec E = R ou C. Théorème 1.87 (critère de Cuchy pour l sommbilité). Soit E un espce vectoriel normé complet. L fmille (u i ) i I d éléments de E est sommble si et seulement si ε >, J fini I, H fini I \ J, S H < ε. (1.35) Avnt d ttquer l preuve du théorème, fisons un peu de recherche en pternité en comprnt (1.35) vec le critère de Cuchy clssique pour une série. Supposons donc pour un instnt que I = N. Le critère de Cuchy clssique pour l série de terme générl u k s écrit : ε >, n N, p, q n, S p S q < ε. (1.36) On peut toujours pr confort d écriture supposer p q. Définissons les ensembles d entiers consécutifs H p,q := {p,..., q} = [p, q] N. Avec cette nottion, on peut réécrire (1.36) sous l forme équivlente ε >, H,n N, H p,q N \ H,n, SHp,q < ε. (1.37) Cette écriture étblit l filition de (1.35) à prtir de (1.36) et nous permet de voir que (1.35) implique (1.36). L réciproque est fusse en rison de l remrque 1.82 et du théorème 1.87. Pr exemple l série de terme générl u k = ( 1) k /(k +1) est convergente donc vérifie le critère de Cuchy (1.36). Pourtnt elle n est ps sommble, donc ne vérifie ps (1.35). Ch. Suquet, Cours I.P.É. 21 41
Chpitre 1. Dénombrer et sommer Preuve de «sommbilité (1.35)». Supposons d bord (u i ) i I sommble. Pour tout ε >, il existe une prtie finie J de I telle que pour toute prtie finie K de I contennt J, S K S < ε/2. En ppliqunt cette inéglité vec K = J, puis K = J H, pour H prtie finie quelconque de I \ J, on obtient : S J S < ε 2 et S J H S < ε 2. Les ensembles d indices J et H étnt disjoints et finis, S J H = S J + S H. En écrivnt S H = (S J H S) (S J S), l inéglité tringulire nous donne S H < ε. Ceci étblit (1.35). Notons que nous n vons ps utilisé l complétude de E dns cette prtie. Preuve de «(1.35) sommbilité». Pour étblir l réciproque, supposons que l fmille (u i ) i I d éléments de E vérifie (1.35). Vérifions d bord que l ensemble d indices I := {i I; u i } est u plus dénombrble 19. En ppliqunt (1.35) vec ε = 1/n, pour tout n 1, on obtient une suite de prties finies J n de I telles que si H I \ J n est fini, S H < 1/n. Ceci est vri en prticulier vec H = {i}, pour i / J n. Donc si i / J n, u i < 1/n. Ainsi si i / J n, n 1 utrement dit si i (I \ J n ), on u i < 1/n pour tout n 1, d où u i =, n 1 puis u i =. On en déduit que I est inclus dns J n. Ce dernier ensemble est u plus n 1 dénombrble comme union dénombrble d ensembles finis, donc I est lui-même u plus dénombrble. Le cs I fini est immédit : on pose J = I, S := S I (bien défini comme somme d un nombre fini de vecteurs de E). Pour tout K fini contennt I, S K = S I + S K\I = S I puisque pour les i K \ I, u i =. On donc S K = S pour tout K I, donc fortiori S K S < ε pour tout ε > (ici on même J indépendnt de ε). Ainsi (u i ) i I est sommble de somme S. Pssons u cs I infini (donc ici dénombrble). Fixons une bijection f : N I et définissons pour k N, v k := u f(k). Notons T n = v + + v n l n-ième somme prtielle de l série de vecteurs + k= v k. Vérifions que l suite (T n ) n N stisfit u critère de Cuchy clssique dns E. Pour ε >, choisissons l un des ensembles J ssociés à ε pr (1.35). Il est clir que l on peut remplcer J pr J := J I puisque pour les i / I, u i =. J est fini donc pr surjectivité de f, il existe un entier m ε tel que f({,..., m ε }) recouvre J. Alors pour m ε < m n, H := f({m,..., n}) est fini et disjoint de J, donc pr (1.35), S H < ε, ce qui peut encore s écrire T n T m < ε. Ainsi l suite T n est de Cuchy dns l espce complet E. Elle est donc convergente. Notons S s limite. Nous llons montrer pour finir que (u i ) i I est sommble de somme S. En conservnt les nottions qui ont servi à vérifier que (T n ) est de Cuchy et en choisissnt pour tout n m ε, H n := f({m ε,..., n}), on T n T mε < ε. Compte-tenu de l convergence de T n vers S, on en déduit en fisnt tendre n vers l infini que S T mε ε. Notons J := f({,..., m ε }) et rppelons que J J = I J, où J est ssocié à ε pr (1.35). 19. Attention, ceci ressemble à l proposition 1.85, mis ici on suppose (1.35) vrie u lieu de l sommbilité de (u i ) i I. 42 Ch. Suquet, Cours I.P.É. 21
1.5. Fmilles sommbles D utre prt S J = T mε, d où S J S ε. Soit K une prtie finie de I, contennt J. En écrivnt que S K = S J + S K\J = S + (S J S) + S K\J, on obtient pr inéglité tringulire S K S S J S + S K\J ε + S K\J. (1.38) Puisque K\J est fini et disjoint de J (cr J J ), on S K\J < ε. En reportnt ceci dns (1.38), on voit que pour tout K fini contennt J, S K S < 2ε. Ce risonnement étnt vlble pour tout ε > (vec J dépendnt de ε), on conclut que (u i ) i I est sommble de somme S. Corollire 1.88. Soit (u i ) i I une fmille d éléments de l espce vectoriel normé complet E. Si ( u i ) i I est sommble dns R +, lors (u i ) i I est sommble dns E. On dit dns ce cs qu elle est normlement sommble ou si E = R ou C, bsolument sommble. Preuve. En ppliqunt l prtie «sommbilité (1.35)» du théorème 1.87 à l fmille ( u i ) i I, ici l espce vectoriel est R, on obtient : ε >, J fini I, H fini I \ J, u i < ε. Pr inéglité tringulire on en déduit : S H i H u i < ε. i H L prtie «(1.35) sommbilité» du théorème 1.87 ppliquée cette fois à l fmille (u i ) i I dns l espce E nous fournit l sommbilité de cette dernière. Nous sommes mintennt en mesure de fire un point définitif sur les différents modes de sommtion étudiés pour une fmille dns R ou C. Proposition 1.89. Pour une fmille (u i ) i I vec I dénombrble et les u i dns R ou C, les trois propriétés sommbilité, convergence commuttive et sommbilité bsolue sont équivlentes. Preuve. Cette équivlence résulte du théorème 1.86, du corollire 1.88 et des théorèmes 1.68 et 1.76. Le prochin corollire nous ser utile pour étblir le théorème de sommtion pr pquets. Corollire 1.9 (du th. 1.87). Soit (u i ) i I une fmille sommble d éléments de l espce vectoriel normé complet E. ) Pour toute prtie L de I, finie ou non, (u i ) i L est sommble. On noter S L s somme. Ch. Suquet, Cours I.P.É. 21 43
Chpitre 1. Dénombrer et sommer b) Pour tout ε >, soit J une prtie finie de I telle que pour toute prtie finie K J de I, S S K < ε. Alors on S S L ε pour toute prtie L J de I, finie ou non. c) Si L 1,..., L n sont des prties deux à deux disjointes de I, de réunion L, lors S L = S L1 + + S Ln. Preuve du ). Utilisons le critère de Cuchy (1.35). ε >, J fini I, K fini I \ J, S K < ε. Ceci est vri en prticulier pour toute prtie finie K de L disjointe de J, utrement dit pour toute prtie finie K de L disjointe de J := J L. Nous vons donc ε >, J fini L, K fini L \ J, S K < ε. Ainsi (u i ) i L est sommble pr le critère de Cuchy (1.35). Preuve du b). Pr le ), l fmille (u i ) i L est sommble. Il existe donc pour tout n N une prtie finie J n de L telle que pour tout ensemble fini K n vérifint J n K n L, S L S Kn < 1/n. D utre prt on pour tout K fini vérifint J K L I, S S K < ε. Pour l ensemble fini K n := K K n qui contient J n et J, on donc à l fois S S K n < ε et S L S K n < 1/n. Pr inéglité tringulire, on en déduit S S L < ε + 1/n. Cette inéglité étnt vrie pour tout n et son premier membre ne dépendnt ps de n, on en déduit en fisnt tendre n vers + vec ε fixé, que S S L ε. Preuve du c). Pr le ), on sit que les n sous-fmilles (u i ) i Ll, l = 1,..., n sont sommbles. Ainsi pour tout ε >, tout l = 1,..., n, il existe J l prtie finie de L l telle que pour tout K l fini vérifint J l K l L l, S Kl S Ll < ε/n. Posons J = J 1 J n et soit K une prtie finie quelconque de L = L 1 L n, contennt J. En prennt K l := K L l, les K l des ensembles finis deux à deux disjoints et de réunion K, d où S K = S K1 + + S Kn. On lors pr inéglité tringulire : S K n n S Ll = (S Kl S Ll ) l=1 l=1 n S Kl S Ll < n ε n = ε. On insi vérifié que (u i ) i L est sommble de somme n l=1 S L l. Théorème 1.91 (de sommtion pr pquets). Soit (u i ) i I une fmille d éléments de l espce vectoriel normé complet E. On suppose que I = I α, les I α étnt non vides α A et deux à deux disjoints. Si (u i ) i I est sommble de somme S, lors chcune des fmilles (u i ) i Iα est sommble et en notnt S Iα s somme, l fmille (S Iα ) α A est sommble de somme S. Autrement dit on l formule de «sommtion pr pquets» : u i = ( ) u i. (1.39) i I α A i I α l=1 44 Ch. Suquet, Cours I.P.É. 21
1.5. Fmilles sommbles Preuve. Pour tout α A, l sous-fmille (u i ) i Iα est sommble pr le corollire 1.9 ). Pour toute prtie finie C de A, nous pouvons lors définir T C := α C S I α, somme d un nombre fini de vecteurs de E. De même, I C := I α étnt une prtie de I, l fmille α C (u i ) i IC est sommble et nous notons s somme S IC. Pr le c) du corollire 1.9, nous vons T C = S IC. Puisque (u i ) i I est sommble de somme S, on dispose pour tout ε > d un ensemble fini J I tel que pour tout K fini vérifint J K I, S S K < ε. Comme J est fini et I = I α, il existe une prtie finie B de A telle que I B contienne J. Pour tout C fini α A inclus dns A et contennt B, I C I B J, donc pr le corollire 1.9 b) (même vec I C infini) on S S IC ε. Compte-tenu de l églité S IC = T C, on insi montré que ε >, B fini A, C fini tel que B C A, S T C ε. Autrement dit, (S Iα ) α A est sommble de somme S. Remrque 1.92. Il importe de noter que l sommbilité de l fmille (S Iα ) α A n implique ps celle de l fmille (u i ) i I. Voici un contre exemple vec E = R : on prend I = Z, u i = i, A = N et pour tout k A, I k = { k, k}. Alors pour tout k A, S Ik = et l fmille (S Ik ) k N est sommble de somme. Pr contre l fmille (u i ) i Z n est ps sommble puisque i Z i = +. Les fmilles de réels positifs constituent à nouveu un cs prticulier pour l sommtion pr pquets (et une exception à l remrque 1.92). Il est nturel ici d élrgir un peu le problème en considérnt les fmilles d éléments de R +. On prolonge l ddition de R + à R + en posnt x R +, x + (+ ) = (+ ) + x = + et (+ ) + (+ ) = +. Avec cette convention, on peut toujours définir l somme de n importe quelle fmille d éléments de R + en utilisnt (1.32). Théorème 1.93 (de sommtion pr pquets dns R + ). Toute fmille (u i ) i I d éléments R + vérifie l formule de sommtion pr pquets (1.39) interprétée comme églité dns R +. Preuve. Si M := i I u i < +, nécessirement tous les u i sont finis et l fmille (u i ) i I est sommble (prop 1.83). Il n y lors rien à démontrer puisqu on est dns le chmp d ppliction du théorème 1.91. L démonstrtion générle pr les suprem que l on présente mintennt englobe ce cs et l vntge d éviter de discuter suivnt l finitude ou non des u i ou des S Iα. Notons M := sup S K et M := sup S IB. K fini I B fini A Avec ces nottions, l églité (1.39) s écrit M = M. Nous llons montrer que M M et que M M. Pour l première inéglité, il suffit de remrquer que pour tout B fini inclus dns A, S IB = sup S L, (1.4) L fini I B Ch. Suquet, Cours I.P.É. 21 45
Chpitre 1. Dénombrer et sommer d où en mjornt S L pr M, S IB M, puis en prennt le supremum pour tout B fini inclus dns A, M M. Dns l utre sens, soit K une prtie finie quelconque de I. Il existe une prtie finie B de A telle que I B = α B I α recouvre K. D près (1.4) on lors S K S IB. En mjornt S IB pr M, on voit que pour tout K fini inclus dns I, S K M. En prennt le supremum sur K, on obtient M M. Théorème 1.94. Soit (u i ) i I une fmille d éléments de l espce vectoriel normé complet E. On suppose que I = α A I α, les I α étnt non vides et deux à deux disjoints. On pose T Iα := i I α u i. L fmille (u i ) i I est normlement sommble dns E si et seulement si α A T I α < +. Elle vérifie lors l formule de sommtion pr pquets (1.39). Preuve. L sommbilité dns R + de ( u i ) i I équivut à α A T I α < + d près le théorème 1.93 et l proposition 1.83. Si (u i ) i I est normlement sommble dns E (cf. corollire 1.88) elle est sommble. Elle vérifie donc l formule de sommtion pr pquets pr le théorème 1.91. 1.6 Séries doubles Nous exminons mintennt le cs prticulier des fmilles (u i ) i I indexées pr un produit crtésien I = I I. On prle dns ce cs de «série double». Nous nous limiterons u cs où I = N 2, mis il est fcile d dpter les énoncés ci-dessous à I = I I vec I et I dénombrbles, une fois fixées des bijections N I et N I. L indice i est désormis un couple d entiers, i = (k, l) N 2. Pour des risons typogrphiques, nous écrirons {u k,l ; (k, l) N 2 } de préférence à (u (k,l) ) (k,l) N 2. Définition 1.95 (série double). Soit (u k,l ) k,l N une suite double d éléments de l espce vectoriel normé E. On dit que l série double de terme générl u k,l est convergente (resp. normlement convergente) si l fmille {u k,l ; (k, l) N 2 } est sommble (resp. normlement sommble). L somme S de cette fmille est lors ppelée somme de l série double et notée S = u k,l = u k,l. (k,l) N 2 k,l N Dns tout ce qui suit, nous donnerons les énoncés reltifs ux séries doubles à termes réels ou complexes en nous contentnt d indiquer sous forme de remrques ou de commentires les modifictions à pporter pour l générlistion ux espces vectoriels normés. Pour E = R ou C, l sommbilité normle s ppelle sommbilité bsolue et équivut à l sommbilité. Il importe de bien comprendre que contrirement u cs des séries simples, l définition 1.95 n utorise ps l existence d une série double à termes dns R ou C qui soit convergente sns l être bsolument. Il peut rriver que pour une certine bijection f : N N 2, l série simple + j= u f(j) soit convergente sns l être bsolument, mis dns ce cs l série double k,l u k,l est divergente (cf. th. 1.86 et th. 1.76). Voici un premier critère de convergence pour les séries doubles. 46 Ch. Suquet, Cours I.P.É. 21
1.6. Séries doubles Proposition 1.96. Pour que l série double de terme générl réel ou complexe u k,l (k, l N) soit convergente, il fut et il suffit que l suite des sommes finies T n := u k,l, n N, k+l n soit bornée. On le même énoncé vec T n := mx(k,l) n u k,l, n N. Attention à bien noter l indextion de l somme T n pr l condition k + l n et non ps k + l = n. Cet énoncé se générlise ux séries à termes dns E espce vectoriel normé complet en remplçnt «convergente» pr «normlement convergente» et u k,l pr u k,l. Preuve. Vérifions d bord que l condition est nécessire en supposnt que l série double de terme générl u k,l est convergente. Alors l fmille {u k,l ; (k, l) N 2 } est bsolument sommble. On lors d près l proposition 1.83 b) : M := sup u k,l < +. (1.41) K fini N 2 (k,l) K Comme T n est l somme des termes indexés pr le sous-ensemble fini de N 2, D n := {(k, l) N 2 ; k + l n}, on T n M pour tout n donc l suite (T n ) n N est bornée. Le même rgument vut pour (T n) en remplçnt D n pr C n := {,..., n} 2. Réciproquement, supposons que l suite (T n ) n N soit bornée pr un réel positif M 1. Soit K une prtie finie quelconque de N 2. Il existe lors un entier n tel que D n recouvre K : il suffit de choisir pour cel n = mx{k + l; (k, l) K}. Alors u k,l u k,l = T n M 1 (k,l) K (k,l) D n et comme l ensemble fini K est quelconque, ceci montre que (1.41) est vérifiée vec M M 1. L sommbilité bsolue de {u k,l ; (k, l) N 2 } en découle pr l proposition 1.83 ). L dpttion à T n est immédite. À titre d exercice, on pourr montrer qu une condition nécessire et suffisnte de convergence de l série double de terme générl réel ou complexe u k,l (k, l N) est l existence d une suite (K n ) n N croissnte pour l inclusion 2 de prties finies de N 2, telle que K n = N 2 et que l suite de terme générl n N T n := u k,l (k,l) K n soit bornée. Le théorème suivnt fournit à l fois un critère de convergence des série doubles et une méthode de clcul de l somme. 2. i.e. telle que pour tout n N, K n K n+1. Ch. Suquet, Cours I.P.É. 21 47
Chpitre 1. Dénombrer et sommer Théorème 1.97 (d interversion des sommtions). 1. Si les v k,l sont des éléments de R +, les églités v k,l = (k,l) N 2 + { + } v k,l = k= l= + { + } v k,l l= k= (1.42) sont toujours vérifiées dns R +. 2. Si les u k,l sont réels ou complexes, l série double de terme générl u k,l converge si et seulement si l une des deux conditions suivntes est rélisée : { + + } { + + } ) u k,l < + ou b) u k,l < +. (1.43) k= l= Dns ce cs, pour tout k N, l série simple + l= u k,l est bsolument convergente et il en v de même en échngent les rôles de k et l. On de plus l formule d interversion des sommtions : { + + } { + + } u k,l = u k,l = u k,l. (1.44) (k,l) N 2 k= l= l= k= Ce théorème s étend u cs où les u k,l sont dns E espce vectoriel normé complet en remplçnt u k,l pr u k,l, l convergence de l série double pr s convergence normle et l convergence bsolue des séries simples pr leur convergence normle. Preuve. Le cs des termes positifs est une ppliction immédite du théorème 1.93 en considérnt les deux décompositions suivntes de N 2, cf. figure 1.5 : ) N 2 = k N ( {k} N ) l= k= b) N 2 = l N ( N {l} ). (1.45) Dns le cs des termes réels ou complexes, l condition (1.43 ) utilisée vec l décomposition (1.45 ) équivut à l sommbilité bsolue de {u k,l ; (k, l) N 2 } pr le théorème 1.94. Il en v de même pour (1.43 b) utilisée vec l décomposition (1.45 b). L sommbilité bsolue de {u k,l ; (k, l) N 2 } implique chcune des conditions (1.43 ) et (1.43 b) pr le théorème 1.94. L première des deux implique l convergence bsolue de toutes les séries + l= u k,l, l deuxième celle des séries + k= u k,l. Enfin lorsque {u k,l ; (k, l) N 2 } est sommble, on obtient (1.44) en ppliqunt l formule de sommtion pr pquets (th. 1.91) ux décompositions (1.45 ) et (1.45 b). Une ppliction clssique de l théorie des séries doubles est le produit de deux séries bsolument convergentes. 48 Ch. Suquet, Cours I.P.É. 21
1.6. Séries doubles l l k k Fig. 1.5 Découpges ) et b) de N 2 Théorème 1.98 (produit de deux séries). Soient + k= u k et + l= v l deux séries à termes réels ou complexes, bsolument convergentes. Alors l série double de terme générl u k v l est convergente et on { + } { + } { } + u k v l = u k v l = u k v l. (1.46) (k,l) N 2 k= l= n= k+l=n L série simple de terme générl w n = k+l=n u kv l est bsolument convergente. On l ppelle série produit de + k= u k et + l= v l. Preuve. Commençons pr vérifier l convergence de l série double. Posons U n := n u k, U := k= + k= u k, U bs n := n u k U bs := k= + k= u k et définissons de même V n, V, Vn bs et V bs en remplçnt u k pr v l. Le produit Un bs Vn bs = u k v l (k,l) {,...,n} 2 est exctement l somme T n de l proposition 1.96. Comme il est borné pr l constnte U bs V bs indépendnte de n, l proposition 1.96 nous ssure de l convergence de l série double de terme générl u k v l. En ppliqunt l formule de sommtion pr pquets à cette série vec le découpge N 2 = k N ({k} N), on obtient : { + + } u k v l = u k v l, (k,l) N 2 k= l= Ch. Suquet, Cours I.P.É. 21 49
Chpitre 1. Dénombrer et sommer où chcune des séries simples + l= u kv l est bsolument convergente. Dns une telle série, on peut mettre en fcteur l «constnte» u k, d où { + + } u k v l = u k v l. (k,l) N 2 k= l= Dns l série indexée pr k, on peut mettre en fcteur l «constnte» { + l= v l}, d où { + } + u k v l = v l u k, (k,l) N 2 l= k= ce qui chève l vérifiction de l première églité dns (1.46). L deuxième églité dns (1.46) résulte de l ppliction du théorème de sommtion pr pquets à l fmille sommble {u k v l ; (k, l) N 2 } vec le découpge N 2 = n N {(k, l) N 2 ; k + l = n}. Le même découpge utilisé vec le théorème 1.94 nous l n k+l=n n k Fig. 1.6 Découpge N 2 = n N {(k, l) N 2 ; k + l = n} fournit l convergence de l série à termes positifs := u k v l. w bs n k+l=n Cette dernière convergence entrîne pr comprison, l convergence bsolue de l série de terme générl w n, puisque w n wn bs pr inéglité tringulire. 5 Ch. Suquet, Cours I.P.É. 21
Chpitre 2 Événements et Probbilités Ce chpitre reprend essentiellement les deux premiers chpitres du cours de deuxième nnée 1 : Espces Probbilisés et Conditionnement et Indépendnce. L principle innovtion est l mise en plce de rudiments de théorie de l mesure (essentiellement du vocbulire) en vue de pouvoir disposer d emblée d exemples de probbilités sortnt du cdre des probbilités discrètes. Nous pourrons insi modéliser l expérience létoire consistnt à choisir un point u hsrd sur le segment [, 1]. Le lngge de l mesure est présenté dns l première section. L deuxième section contient une pproche informelle de l modélistion de l létoire vnt de présenter à l section 3 les xiomes de l théorie des probbilités et les propriétés générles des probbilités. On exmine ensuite les notions de conditionnement et d indépendnce. 2.1 Notion de mesure Soit Ω un ensemble, on note P(Ω) l ensemble des prties de Ω. Une mesure sur Ω est une fonction d ensembles m qui à certines prties A de Ω, ssocie un réel positif m(a) ppelé mesure de A. L théorie que nous llons présenter fournit un cdre mthémtique commun pour des notions comme le dénombrement, l mesure des grndeurs géométriques (longueur, ire, volume), physiques (msse) et les probbilités. À prtir du concept de mesure, on peut bâtir une intégrle 2 sur l ensemble Ω permettnt d unifier les notions d intégrle simple ou multiple u sens clssique, de série bsolument convergente et d espérnce mthémtique d une vrible létoire. Il est commode d élrgir d emblée l ensemble d rrivée de m à R + u lieu de R +, pr exemple pour pouvoir dire que l ire d un qurt de pln est +. Intuitivement, en pensnt pr exemple à l mesure des ires, les propriétés minimles que l on puisse exiger de m sont ) l croissnce : si A B, m(a) m(b), b) l dditivité : si A B =, m(a B) = m(a) + m(b), sous réserve que m(a), m(b) et m(a B) soient définies. 1. Introduction u Clcul des Probbilités, http://mth.univ-lille1.fr/~suquet/index.html 2. Appelée «intégrle de Lebesgue». S construction n est ps u progrmme de ce cours. 51
Chpitre 2. Événements et Probbilités Il est fcile de voir que l croissnce est une conséquence de l dditivité en écrivnt si A B, B = A (B \A) et m(b) = m(a)+m(b \A) m(a), vec les mêmes réserves d existence. L dditivité s étend pr une récurrence immédite, ux suites finies A 1,..., A n d ensembles, donnnt l dditivité finie : m(a 1 A n ) = m(a 1 ) + + m(a n ) si les A i sont deux à deux disjoints. Pr contre elle ne s étend ps utomtiquement ux suites infinies d ensembles deux à deux disjoints. Pour voir une théorie ssez riche, on doit pouvoir effectuer certins pssges à l limite, pr exemple pour pouvoir mesurer l ire d un disque dns le pln en le «pvnt» pr des crreux à côtés prllèles ux xes. L propriété correspondnte est ppelée σ-dditivité : ( ) + si les A n sont deux à deux disjoints, m A n = m(a n ), n N pourvu que toutes ces quntités soient définies. Pourquoi ces cluses restrictives sur l existence des m(a)? Il se trouve que dns l pluprt des cs intéressnts (suf lorsque Ω est u plus dénombrble), on ne sit ps définir m(a) pour tout A P(Ω). Souvent pour construire une mesure m, on commence pr ttribuer une vleur à m(a) pour chque A dns une fmille C bien prticulière de prties de Ω. Pr exemple si Ω = R, on peut prendre pour C l fmille des intervlles ], b] et «décider» que m(], b]) := b, choisissnt insi de mesurer ], b] pr s longueur 3. De même si Ω = R 2, on peut prtir de l fmille C des «rectngles» R =], b] ]c, d] et décider que m(r) := (b )(d c). Dns un deuxième temps, on essie de prolonger m à une fmille F de prties de Ω plus grnde que C, tout en préservnt l σ-dditivité. Il se trouve qu il n est ps toujours possible de réliser ce prolongement jusqu à prendre F = P(Ω). Certines prties de R sont d une trop grnde complexité pour qu on puisse leur ttribuer une «longueur». Ainsi l fonction d ensembles m un ensemble de définition qui est une sous-fmille de P(Ω). Cet ensemble de définition de m est ce que l on ppelle une tribu de prties de Ω. Il est temps mintennt de formliser les définitions suivntes. Définition 2.1 (tribu). Une fmille F de prties de Ω est ppelée tribu (ou σ-lgèbre) sur Ω si elle ) possède l ensemble vide : F ; b) est stble pr pssge u complémentire : A F, A c F ; c) est stble pr union dénombrble : ( i N, A i F) A i F. i N On vérifie fcilement à prtir de cette définition qu une tribu est stble pr unions ou intersections finies et pr intersections dénombrbles. Définition 2.2 (mesure). Soit F une tribu sur Ω. On ppelle mesure positive sur (Ω, F) une ppliction m : F [, + ], vérifint 3. Il y bien d utres choix possibles, on pourrit poser plus générlement m(], b]) := F (b) F () où F est une fonction croissnte R R, continue à droite. n= 52 Ch. Suquet, Cours I.P.É. 21
2.1. Notion de mesure ) m( ) = ; b) m est σ-dditive : pour toute suite (A i ) i N d éléments de F deux à deux disjoints, ( ) m A i N i = + i=1 m(a i ). (2.1) Dns l définition de l σ-dditivité, ou de l stbilité pr union dénombrble, on urit évidemment pu tout ussi bien indexer l suite (A i ) pr N u lieu de N. Remrque 2.3. L réunion des A i est invrinte pr permuttion sur les indices et si chque A i est à son tour union dénombrble d ensembles B i,j F (j N ) deux à deux disjoints, on clirement A i N i = i N B j N i,j = B i,j. (i,j) N N On voit ici que l on un besoin crucil des propriétés de convergence commuttive et de sommtion pr pquets dns R +. Sns elles l définition de l σ-dditivité serit incohérente. Voyons mintennt des exemples de tribus qui nous seront utiles. Les trois exemples les plus simples sont les suivnts. L tribu trivile sur Ω est F = {Ω, }. P(Ω) est une tribu. Si A est une prtie de Ω, lors F := {Ω,, A, A c } est une tribu. C est l plus petite tribu possédnt A comme élément, i.e. toute tribu G telle que A G contient F. On dit que F est l tribu engendrée pr A. Cette notion de tribu engendrée se générlise en remrqunt que si (G i ) i I est une fmille quelconque de tribus sur Ω, G := i I G i est une tribu sur Ω (vérifiction immédite à prtir de l définition 2.1). Définition 2.4 (tribu engendrée). Soit C une fmille de prties d un ensemble Ω. On ppelle tribu engendrée pr C, et on note σ(c), l plus petite tribu contennt C (c est l intersection de toutes les tribus sur Ω contennt C). Définition 2.5 (tribu borélienne). On ppelle tribu borélienne sur R d l tribu engendrée pr l fmille O des ensembles ouverts 4 de R d. On l noter Bor(R d ). Ainsi Bor(R d ) = σ(o). Les sous-ensembles de R d qui sont éléments de s tribu borélienne sont ppelés boréliens de R d ou boréliens tout court qund il n y ps d mbiguïté. Remrque 2.6. On peut démontrer que Bor(R) est ussi l tribu engendrée pr les fermés de R, ou pr les intervlles ouverts, ou les intervlles fermés, ou les semi-ouverts, ou les intervlles (ouverts ou fermés) à extrémités rtionnelles, ou les intervlles ], ], ou les intervlles [, + [. De même, Bor(R d ) est engendrée pr les pvés ouverts ou pr les pvés de l forme d k=1 ] k, b k ]. 4. Un ensemble ouvert de R d est une réunion (quelconque) de pvés ouverts d k=1 ] k, b k [. Un fermé est le complémentire d un ouvert. Ch. Suquet, Cours I.P.É. 21 53
Chpitre 2. Événements et Probbilités Voyons mintennt des exemples importnts de mesures. Exemple 2.7 (msse de Dirc). Soit x un élément fixé de Ω. On ppelle msse de Dirc u point x ou mesure de Dirc u point x, l mesure δ x sur (Ω, P(Ω)) définie pr { 1 si x A, A P(Ω), δ x (A) := si x / A. Pr restriction, δ x est ussi une mesure sur (Ω, F) pour toute tribu F sur Ω. Vérifiction. Il est clir que δ x ( ) =. Pour montrer l σ-dditivité, soit (A n ) n N une suite d éléments de P(Ω), deux à deux disjoints. Nous distinguons deux cs. ( ) ) x / A n. Alors δ x A n =. D utre prt, x ne peut pprtenir à ucun n N n N des A n, donc pour tout n N, δ x (A n ) = et n N δ x (A n ) =. ( ) b) x A n. Alors δ x A n = 1. D utre prt, comme les A n sont deux à deux n N n N disjoints, x doit pprtenir à un seul des A n, disons A n. Ainsi, δ x (A n ) = 1 et pour tout n n, δ x (A n ) =, d où n N δ x (A n ) = 1. Dns les deux cs, on ( ) δ x A n = δ x (A n ), n N n N δ x est donc bien σ-dditive. C est une mesure sur (Ω, P(Ω)). Exemple 2.8 (série de mesures finies). Si les (µ k ) k N sont des mesures finies 5 sur (Ω, F) et si ( k ) k N est une suite de réels positifs, l fonction d ensembles µ = k N kµ k définie sur F pr µ : F R +, A µ(a) := k N k µ k (A) est une mesure sur (Ω, F). Le résultt se générlise à µ = i I iµ i, vec I u plus dénombrble. Vérifiction. Pour tout k, k < +, donc k µ k ( ) = et µ( ) = k N kµ k ( ) =. Soit (A n ) n N une suite d éléments de F, deux à deux disjoints. En utilisnt l σ-dditivité de chque µ k et l interversion des sommtions pour les séries doubles à termes positifs, on peut écrire : ( ) µ A n = ( ) k µ k A n = { k µ k (A n ) n N n N k N k N n N } = { } k µ k (A n ) k N n N = { } k µ k (A n ) n N k N = n N µ(a n ), 5. L mesure µ k est finie si µ k (A) < + pour tout A F. Elle est donc ussi bornée puisque µ k (A) µ k (Ω) < +. L hypothèse «µ k finie» nous évite l gestion du conflit k = et µ k (A) = +. 54 Ch. Suquet, Cours I.P.É. 21
2.1. Notion de mesure ce qui étblit l σ-dditivité de µ. Exemple 2.9 (mesure ponctuelle). Soient I un ensemble u plus dénombrble, (x i ) i I une fmille dns Ω et ( i ) i I une fmille de réels positifs. Alors µ := i I iδ xi est une mesure sur (Ω, P(Ω)), donc ussi pr restriction sur tout espce mesurble (Ω, F). C est un cs prticulier de l exemple précédent. Les mesures de ce type sont ppelées mesures ponctuelles. Remrque 2.1. Si Ω = {ω i ; i I} est u plus dénombrble, toute mesure sur (Ω, P(Ω)) qui est finie sur les singletons est une mesure ponctuelle. Vérifiction. L tribu P(Ω) possède les singletons (qund Ω est fini ou dénombrble, c est même l seule tribu ynt cette propriété). Soit µ une mesure sur (Ω, P(Ω)). On peut définir i I, i := µ({ω i }), en notnt que puisque µ est finie sur les singletons, i < +. Considérons lors l mesure ponctuelle ν := i δ ωi. i I Soit A P(Ω), lors A est fini ou dénombrble et on peut l écrire comme union disjointe finie ou dénombrble de singletons : A = {ω i }. ω i A Pr σ-dditivité (ou pr dditivité qund A est fini, cf. prop. 2.16 ci-dessous), on donc µ(a) = ω i A µ({ω i }) = ω i A i = i I i δ ωi (A) = ν(a). Ainsi pour tout A P(Ω), µ(a) = ν(a), donc µ = ν et µ est une mesure ponctuelle. Exemple 2.11 (mesure de comptge). Si Ω = {ω i ; i I} est u plus dénombrble, l ppliction µ : P(Ω) R + définie pr { crd A si A est fini, A P(Ω), µ(a) = + sinon, est une mesure, ppelée mesure de comptge. Pour le voir, il suffit de remrquer que pour tout A, µ(a) = ν(a), où ν est définie comme l mesure ponctuelle ν = i I δ ω i. Exemple 2.12. Soit µ une mesure sur (Ω, F) et B F. L fonction d ensembles ν = µ(. B) définie sur F pr A F, ν(a) := µ(a B) Ch. Suquet, Cours I.P.É. 21 55
Chpitre 2. Événements et Probbilités est une mesure sur (Ω, F). Si de plus < µ(b) < +, l fonction d ensembles µ B définie sur F pr µ(a B) A F, µ B (A) := µ(b) est une mesure sur (Ω, F), vérifint µ B (Ω) = 1, utrement dit une probbilité 6. Qund µ = P est déjà une probbilité sur (Ω, F), l mesure P B est ppelée probbilité conditionnelle ; nottion : P B (A) =: P (A B). Vérifiction. On se contente de vérifier que ν est σ-dditive, tout le reste étnt évident. Soit (A i ) i N une suite d éléments de F, deux à deux disjoints. Pour i j, A i A j = et comme (A i B) (A j B) A i A j, les A i B sont ussi deux à deux disjoints. De plus on ( i N A i ) B = i N (A i B). L σ-dditivité de ν découle lors clirement de celle de µ. Exemple 2.13 (mesure de Lebesgue λ d ). Nous dmettons qu il existe une unique mesure µ sur (R d, Bor(R d )) telle que pour tout pvé d i=1 ] i, b i ] non vide 7, ( d ) µ ] i, b i ] = i=1 d (b i i ). On l ppelle mesure de Lebesgue sur R d et on l note λ d. Pour d = 1, on étend insi l notion de longueur des intervlles à tous les ensembles membres de Bor(R), pour d = 2 on étend de même l notion d ire des rectngles à tous les ensembles boréliens du pln R 2, pour d = 3, on étend l notion de volume. Pour d > 3, on continuer à prler de volume ou d hypervolume. Nous dmettrons que les formules clssiques de clcul d ire ou de volume se réécrivent à l ide de λ d. Pr exemple si D est un disque de ryon r de R 2, λ 2 (D) = πr 2. Plus générlement, voici les principles propriétés de l mesure de Lebesgue. Proposition 2.14. L mesure de Lebesgue λ d sur (R d, Bor(R d )) les propriétés suivntes. i) λ d est invrinte pr trnsltions : si h : x x+c est une trnsltion de R d, lors pour tout B Bor(R d ), h(b) Bor(R d ) et λ d (B) = λ d ( h(b) ). ii) λ d est invrinte pr toute isométrie euclidienne de R d : symétrie, rottion, etc. iii) Si h est l homothétie x cx dns R d, pour tout borélien B, λ d ( h(b) ) = c d λ d (B). iv) λ d ne chrge ps les points : x R d, λ d ({x}) =. Si A R d est fini ou dénombrble, λ d (A) =. 6. En nticipnt un peu sur l suite du chpitre. 7. Ce qui suppose implicitement que i < b i pour chque i = 1,..., d. i=1 56 Ch. Suquet, Cours I.P.É. 21
v) λ d ( d i=1[ i, b i ] ) = λ d ( d i=1] i, b i [ ) 2.2. Modéliser l létoire et cette églité implique bien sûr, l églité des mesures des 4 d pvés obtenus en jount sur l ouverture ou l fermeture des extrémités i, b i des intervlles. vi) Si E est un sous-espce ffine de R d et E R d, λ d (E) =. Un bon exercice consiste à étblir l formule λ 2 (D) = πr 2 en utilisnt le clcul de l ire de l hypogrphe de l fonction f : [ 1, 1] R, x 1 x 2 pr une intégrle de Riemnn, cf. proposition A.5 p. 218 et certines des propriétés de λ 2 énoncées ci-dessus. 2.2 Modéliser l létoire 2.2.1 Notion d expérience létoire L théorie des probbilités fournit des modèles mthémtiques permettnt l étude d expériences dont le résultt ne peut être prévu vec une totle certitude. Le tbleu 2.1 en donne quelques exemples. Expérience Résultt observble Lncer d un dé Un entier k {1,..., 6} Prélèvement de n objets en sortie Nombre d objets défectueux d une chîne de production dns l échntillon Questionnire à 1 questions Suite ω de 1 réponses binires ω {oui, non} 1 Lncer d une pièce jusqu à l Un entier k N : le temps première obtention de pile d ttente du premier succès Mise en service d une mpoule Durée de vie T R Lncer d une fléchette sur une cible Point d impct Mouvement d un grin de pollen Une fonction continue : dns un liquide l trjectoire Mélnge de deux gz Réprtition sptile de deux types de molécules Tb. 2.1 Quelques expériences létoires typiques Bien que le résultt précis de chcune de ces expériences soit imprévisible, l observtion et l intuition nous mènent à penser que ces phénomènes obéissent à certines lois. Pr exemple si on jette 6 fois un dé, on s ttend à ce que le nombre d ppritions de l fce «3» soit voisin de 1. Si on met en service 1 mpoules, leurs durées de vie observées seront concentrées utour d une certine vleur moyenne. L théorie des probbilités permet de donner un sens précis à ces considértions un peu vgues. L sttistique permet de confronter les modèles probbilistes vec l rélité Ch. Suquet, Cours I.P.É. 21 57
Chpitre 2. Événements et Probbilités observée fin de les vlider ou de les invlider. Pr exemple si quelqu un 6 bonnes réponses sur 1 u questionnire, est-il légitime de considérer qu il «mieux fit» que le hsrd? Sur les n objets prélevés en sortie de chîne, k sont défectueux. Peut-on en déduire quelque chose sur l qulité de l production globle? 2.2.2 Événements L théorie moderne des probbilités utilise le lngge des ensembles pour modéliser une expérience létoire. Nous noterons Ω un ensemble dont les éléments représentent tous les résultts possibles ou événements élémentires d une expérience létoire donnée. Les événements (ou événements composés) seront représentés pr des prties (sousensembles) de Ω. Il n est ps toujours fcile de trouver un ensemble Ω permettnt de modéliser l expérience létoire. Voici une règle prtique pour y rriver : les événements élémentires sont ceux qui contiennent l informtion mximle qu il est possible d obtenir de l expérience. Pr exemple si on jette un dé, l événement A : «obtention d un chiffre pir» n est ps élémentire. Il est composé des trois événements élémentires 2, 4, 6 : A = {2, 4, 6}. Ici Ω = {1, 2, 3, 4, 5, 6}. De même si on lnce trois fois une pièce de monnie, les événements élémentires sont des triplets comme (p,f,p) indiqunt le résultt précis de chcun des trois lncers. Ici Ω = {f, p} 3. L événement B «obtention de pile u deuxième des trois lncers» est composé : B = {(f, p, f); (f, p, p); (p, p, f); (p, p, p)}. Nottions Vocbulire ensembliste Vocbulire probbiliste ensemble vide événement impossible Ω ensemble plein événement certin ω élément de Ω événement élémentire A sous-ensemble de Ω événement ω A ω pprtient à A Le résultt ω est une des rélistions possibles de A A B A inclus dns B A implique B A B réunion de A et B A ou B A B intersection de A et B A et B A c complémentire de A événement contrire de A dns Ω A B = A et B sont disjoints A et B sont incomptibles Tb. 2.2 Lngge ensembliste - lngge probbiliste Avec ce mode de représenttion, les opértions logiques sur les événements : «et», «ou», «négtion» se trduisent pr des opértions ensemblistes : intersection, réunion, 58 Ch. Suquet, Cours I.P.É. 21
2.2. Modéliser l létoire pssge u complémentire. Le tbleu 2.2 présente l correspondnce entre les deux lngges. Les opértions logiques sur les événements peuvent bien sûr fire intervenir plus de deux événements. Ainsi, si A 1,..., A n sont des événements, n i=1 A i = A 1 A 2 A n est l ensemble des ω qui sont dns l un u moins des A i. C est donc l événement «rélistion de l un u moins des A i (1 i n)». De même : n i=1 A i = A 1 A 2 A n est l ensemble des ω qui sont dns tous les A i. C est donc l événement «rélistion de chcun des A i (1 i n)». Ceci s étend ux réunions et intersections d une suite infinie d événements : i N i = {rélistion de l un u moins des A i, i N }, i N i = {rélistion de tous les A i, i N }. Ces opértions logiques sur des suites d événements sont très utiles pour nlyser des événements complexes à l ide d événements plus simples et, comme nous le verrons plus trd, clculer insi des probbilités. 2.2.3 Une question de dés Pour finir cette introduction informelle, nous llons discuter un problème d énoncé très simple pour voir comment les notions de tribu et de mesure s imposent nturellement dès que l on veut évluer une probbilité dns une expérience où pprît l infini. Voici l question. On effectue des lncers répétés d une pire de dés et on observe pour chque lncer, l somme des points indiqués pr les deux dés. On se propose d ttribuer une probbilité à l événement E défini insi : dns l suite des résultts observés, l première obtention d un 9 lieu vnt l première obtention d un 7. On suppose ici déjà connue l définition d une probbilité sur un espce Ω fini : à svoir une ppliction dditive 8 P : P(Ω) R + telle que P (Ω) = 1. Commençons pr modéliser un lncer. Disons que l on un dé bleu et un dé rouge. L informtion mximle que l on puisse envisger ici est de svoir le résultt du dé bleu et celui du rouge. On prendr donc comme espce Ω 1, le crré crtésien {1,..., 6} 2 en convennt de représenter pr le couple (i, j) Ω 1 le résultt du dé bleu (première composnte) et celui du rouge (deuxième composnte). Notons pour i N, F i := {obtention de l somme 9 u i e lncer}, G i := {obtention de l somme 7 u i e lncer}, H i := {obtention d une utre somme que 7 ou 9 u i e lncer}. 8. Si Ω est fini, l σ-dditivité se réduit à l dditivité cr dns toute suite (A n ) de prties de Ω deux à deux disjointes, seul un nombre fini d entre elles ne sont ps vides. Ch. Suquet, Cours I.P.É. 21 59
Chpitre 2. Événements et Probbilités Pour l instnt, nous n envisgeons qu un lncer et nous ttribuerons pr symétrie l même probbilité à tous les évènements élémentires en prennt P 1 ({(i, j)}) = 1/36 pour tout évènement élémentire (i, j). En remrqunt que F 1 est constitué de 4 évènements élémentires : (3, 6), (4, 5), (5, 4) et (6, 3), on en déduit que P 1 (F 1 ) = 4/36 = 1/9. De même, G 1 étnt constitué de 6 évènements élémentires, P 1 (G 1 ) = 6/36 = 1/6, cf. figure 2.1. On en déduit que P 1 (H 1 ) = 1 1/36 = 13/18. 1 2 3 4 5 6 1 7 2 7 3 7 9 4 7 9 5 7 9 6 7 9 Fig. 2.1 Évènements F 1 et G 1 Pour modéliser les n premiers lncers, on voit que l informtion mximle que l on puisse envisger est l connissnce de l suite finie des n couples d entiers représentnt les résultts des n lncers. Ceci conduit à prendre comme espce Ω n = Ω 1 Ω 1 = Ω n 1. Cet Ω n est un ensemble fini de crdinl 36 n. Si nous convenons là encore d ttribuer l même probbilité à tous les évènements élémentires (donc mintennt 36 n ), on obtient l probbilité P n définie sur (Ω n, P(Ω n )) pr A P(Ω n ), P n (A) = crd A crd Ω n. Regrdons le cs prticulier où A est de l forme A 1 A 2 A n, chque A i étnt une prtie de {1,..., 6} 2. Cel signifie que l rélistion de A i ne dépend que du résultt du i e lncer. L formule sur le crdinl d un produit crtésien nous donne lors : P n (A 1 A n ) = crd(a 1 A n ) = (crd A 1) (crd A n ) crd Ω n (crd Ω 1 ) n Appliquons ceci à l évènement E n défini pr = crd A 1 crd A n 36 36 = P 1 (A 1 ) P 1 (A n ). (2.2) E n := {les n 1 premiers lncers ne donnent ni 7 ni 9 et le n e donne 9}. (2.3) On peut représenter 9 E n dns Ω n en écrivnt E n = H 1 H 2 H n 1 F n, donc P n (E n ) = 1 ( 13 ) n 1, 9 18 9. L évènement E n est défini pr l phrse entre les ccoldes dns (2.3). Son écriture ensembliste dépend de l espce Ω considéré. D hbitude, on ne fit ps cette distinction prce qu on trville vec un seul Ω, mis ici elle s impose. 6 Ch. Suquet, Cours I.P.É. 21
2.2. Modéliser l létoire formule vlble pour tout n 1, le cs n = 1 se réduisnt à E 1 = F 1 et P 1 (F 1 ) = 1/9. Pour 1 k < n, on peut représenter E k dns Ω n en écrivnt E k = H 1 H 2 H k 1 F k Ω n k 1. L formule (2.2) nous donne lors n k, P n (E k ) = P 1 (H 1 ) P 1 (H k 1 ) P 1 (F k ) 1 n m = P k (E k ), (2.4) où dns l écriture «P k (E k )», on interprète E k comme une prtie de Ω k, explicitement H 1 H 2 H k 1 F k. Ainsi (2.4) exprime une sorte de comptibilité scendnte des modèles (Ω n, P(Ω n ), P n ). Si on note E n l évènement u cours des n premiers lncers, l première obtention de l somme 9 lieu vnt l première obtention de l somme 7, on grâce à cette comptibilité j n, P j (E n) = P j ( n k=1 E k ) = n P j (E k ), (2.5) en notnt que les E k sont deux à deux disjoints et en utilisnt l dditivité de P j. Pour ttribuer une probbilité à E, on ne peut mlheureusement ps se contenter de (2.5), même vec n «grnd». En effet on ne peut ps exclure que l question de l priorité entre le 9 et le 7 ne soit trnchée qu u delà du n e lncer, voire jmis. Ceci nous conduit à prendre pour Ω l ensemble des suites infinies de couples (i, j) {1,..., 6} 2, utrement dit, Ω = Ω N 1. Notons N k := {j N; j > k}. On peut lors représenter E k dns Ω pr E k = H 1 H 2 H k 1 F k Ω N k 1. Au vu de l formule de comptibilité (2.4), il est nturel d ttribuer une probbilité à E k considéré comme évènement de Ω en définissnt P (E k ) := P k (E k ) = 1 ( 13 ) k 1. 9 18 Finlement, pour pouvoir ttribuer une probbilité à E, on remrque que E est l union des E k pour k N, ces ensembles étnt deux à deux disjoints. On donc bien envie d écrire ( ) P (E) = P E k N k = k N P (E k ) = + k=1 1 9 k=1 ( 13 ) k 1 1 = 18 9 1 1 13 18 = 2 5. L propriété qui nous mnque pour justifier cette écriture est précisément l σ-dditivité. Une utre fçon d obtenir le même résultt est de psser à l limite qund n tend vers l infini dns (2.5), près l voir réécrit sous l forme P (E n) = n P (E k ). k=1 Remrquons que l suite d ensembles E n est croissnte pour l inclusion (E n E n+1) et que n 1 E n = E. L propriété qui nous permettrit de fire cel s ppelle continuité séquentielle croissnte de P (voir prop. 2.16-6.). On voit insi qu il est souhitble de définir l probbilité P sur Ω comme une mesure. Ceci pose l question de l tribu F. En fit tout ce que nous svons fire Ch. Suquet, Cours I.P.É. 21 61
Chpitre 2. Événements et Probbilités ici, c est définir l probbilité d évènements comme les E k, de l forme A Ω N k 1, vec A Ω k. Ces évènements sont ceux dont l rélistion ne dépend que du résultt des k premières épreuves, pour un certin k. On peut dire ussi qu il s git des évènements dont l rélistion ne dépend que d un nombre fini d épreuves. Notons C l fmille de ces évènements. Un évènement comme E n pprtient ps à C, mis à l tribu engendrée pr C, F = σ(c). Cette tribu est plus petite 1 que P(Ω). Enfin, soit H l évènement ucun lncer ne produit l somme 7 ou l somme 9. Avec on clirement K n := H 1 H n Ω Nn 1, H = H N 1 = n 1 K n. L ensemble H pprît insi comme intersection dénombrble d ensembles K n C, ce qui nous ssure de l pprtennce de H à l tribu F. On de plus H K n pour tout n 1, donc pr croissnce de P pour l inclusion (c est une conséquence immédite de l dditivité, cf. prop. 2.16-4.), n 1, P (H) ( 13 ) n. 18 Cette inéglité étnt vérifiée pour tout n, on peut fire tendre n vers l infini pour obtenir P (H) =. On insi un exemple d évènement non vide et de probbilité nulle (H est l ensemble des suites infinies de couples éléments de H 1, il est infini non dénombrble). 2.3 L probbilité comme mesure L probbilité P, telle que nous llons l définir ci-dessous, est une fonction qui à un événement, ssocie un nombre compris entre et 1 et censé mesurer les chnces de rélistion de cet événement. Pour des risons sortnt du cdre de ce cours, il n est ps toujours possible d ttribuer insi de mnière cohérente une probbilité à chque prtie de Ω. En d utres termes, P ne peut ps être considérée comme une ppliction de l ensemble P(Ω) de toutes les prties de Ω dns [, 1] mis comme une fonction ynt pour domine de définition une tribu F générlement plus petite que P(Ω). L tribu F est ussi ppelée fmille des événements observbles 11. Définition 2.15. Soit Ω un ensemble et F une tribu sur Ω. On ppelle probbilité sur (Ω, F) toute ppliction P de F dns [, 1] vérifint : (i) P (Ω) = 1. 1. Nous l dmettrons, mis si vous n êtes ps convincu, essyez de montrer que F = P(Ω)... 11. L définition générle d une tribu F ne suppose ps que tous les singletons {ω} soient des éléments de F. Donc un «événement élémentire» n est ps toujours un événement observble. Nénmoins dns l pluprt des exemples que nous étudierons, l tribu possèder les singletons. 62 Ch. Suquet, Cours I.P.É. 21
2.3. L probbilité comme mesure (ii) Pour toute suite (A j ) j 1 d événements de F deux à deux disjoints (incomptibles) : ( ) + P A j N j = P (A j ). Le triplet (Ω, F, P ) s ppelle espce probbilisé. Définir une probbilité sur (Ω, F) c est en quelque sorte ttribuer une «msse» à chque événement observble, vec pr convention une msse totle égle à 1 pour l événement certin Ω. Une formultion équivlente à l définition 2.15 est : P est une mesure sur (Ω, F) telle que P (Ω) = 1. Proposition 2.16 (propriétés générles d une probbilité). Toute probbilité P sur (Ω, F) vérifie les propriétés suivntes : 1. P ( ) =. j=1 2. Additivité ) Si A B =, P (A B) = P (A) + P (B). b) Si les A i (1 i n) sont deux à deux disjoints : 3. A F, P (A c ) = 1 P (A). P ( n ) n A i = P (A i ). i=1 4. A F, B F, A B P (A) P (B). 5. A F, B F, P (A B) = P (A) + P (B) P (A B). 6. Continuité monotone séquentielle ) Si (B n ) n est une suite croissnte d événements de F convergente 12 vers B F, lors P (B) = lim n + P (B n). Nottion : i=1 B n B P (B n ) P (B) (n + ). b) Si (C n ) n est une suite décroissnte d événements de F convergente 13 vers C F, lors P (C) = lim P (C n). Nottion : n + C n C P (C n ) P (C) 7. ) A F, B F P (A B) P (A) + P (B). b) A 1,..., A n F, P ( n ) n A i P (A i ). i=1 i=1 c) A 1,..., A n,... F, P ( A ) + i i N P (A i ). i=1 12. Ce qui signifie : n, B n B n+1 et B = n B n. 13. Ce qui signifie : n, C n+1 C n et C = n C n. (n + ). Ch. Suquet, Cours I.P.É. 21 63
Chpitre 2. Événements et Probbilités Preuve. Soit P une fonction d ensembles F [, 1] stisfisnt ux conditions (i) et (ii) de l définition 2.15, il s git de démontrer que P vérifie les propriétés 1 à 7. Preuve de 1. Comme P (A j ) pour tout A j F, on toujours j N P (A j ) P (A 1 ) + P (A 2 ), le premier membre pouvnt être égl à +. En choisissnt A j = pour tout j N et en utilisnt l σ-dditivité (ii), on en déduit : P ( ) = P ( A ) + j j N = P (A j ) P ( ) + P ( ). Pr conséquent, P ( ) 2P ( ) et comme P ( ), ceci entrîne P ( ) =. j=1 Preuve de 2. Soient A 1,..., A n, n événements de F deux à deux disjoints. Pour j > n, posons A j =. On insi une suite infinie (A j ) j 1 d événements deux à deux disjoints. En utilisnt l σ-dditivité, on obtient lors : P ( n ) ( A j = P A ) n j j=1 j N = P (A j ) + j=1 + j=n+1 P (A j ). D près 1, l somme pour j n + 1 vut, ceci prouve 2 b). Bien sûr 2 ) n est que le cs prticulier n = 2. Preuve de 3. Prendre B = A c dns 2 ) et utiliser (i). Preuve de 4. Si A B, lors B = A (B A c ) et cette réunion est disjointe. D près 2 ) on P (B) = P (A)+P (B A c ) et comme P (B A c ), on en déduit P (B) P (A). Preuve de 5. On les décompositions suivntes en unions disjointes : En utilisnt l dditivité on en déduit : A B = (A B c ) (A B) (A c B), A = (A B c ) (A B), B = (A B) (A c B). P (A B) = P (A B c ) + P (A B) + P (A c B) = [ P (A B c ) + P (A B) ] + [ P (A B) + P (A c B) ] P (A B) = P (A) + P (B) P (A B). 64 Ch. Suquet, Cours I.P.É. 21
2.3. L probbilité comme mesure Preuve de 6. Il suffit de prouver 6 ), l propriété 6 b) s en déduit en ppliqunt 6 ) à l suite d événements B n = Cn. c Admettons, pour l instnt, que pour tout n 1, B n vérifie l décomposition suivnte en union disjointe (cf. figure 2.2) ( n ) B n = B (B i \ B i 1 ). i=1 B B 1 \ B B 2 \ B 1 Fig. 2.2 Décomposition de B B 1 B 2 en union disjointe En écrivnt l réunion infinie des B n à l ide de cette décomposition et en «effçnt» toutes les répétitions des B i \ B i 1, on en déduit imméditement que B vérifie l décomposition en union disjointe : ( ) B = B i N (B i \ B i 1 ). Pssnt ux probbilités, ces deux décompositions nous donnent : P (B n ) = P (B ) + P (B) = P (B ) + n P (B i \ B i 1 ), i=1 + i=1 P (B i \ B i 1 ). Comme cette série converge, s somme est l limite de l suite de ses sommes prtielles de rng n, ce qui s écrit : P (B) = { lim P (B ) + n + n i=1 } P (B i \ B i 1 ) = lim P (B n). n + Ainsi pour compléter l preuve, il ne reste plus qu à justifier l décomposition de B n. Posons : ( n ) D n = B (B i \ B i 1 ). i=1 Pour montrer que B n = D n, il suffit de montrer que D n B n et B n D n. L première inclusion est évidente puisque pour tout i n, B i \ B i 1 B i B n. Pour prouver l inclusion inverse, on note ω un élément quelconque de B n et on montre que ω pprtient à D n. Soit i = i (ω) le plus petit des indices i tels que ω B i. Comme cet ensemble Ch. Suquet, Cours I.P.É. 21 65
Chpitre 2. Événements et Probbilités d indices contient u moins n, on i n. Si i =, ω B et comme B D n, ω D n. Si i 1, pr l définition même de i, on ω B i et ω / B i 1, donc ω B i \ B i 1 et comme i n, B i \ B i 1 D n donc ω D n. Le risonnement précédent étnt vlble pour tout ω de B n, on en déduit B n D n. Preuve de 7 ). D près 5 : cr P (A B). P (A B) = P (A) + P (B) P (A B) P (A) + P (B), Preuve de 7 b). On remrque que pour tout n 1 on : n i=1 A i = n i=1 B i, où les B i sont des événements deux à deux disjoints définis comme suit : B 1 = A 1, B 2 = A 2 B c 1, B 3 = A 3 (B 1 B 2 ) c,..., B n = A n (B 1 B n 1 ) c. Pr dditivité : P ( n i=1 A i ) = P ( n i=1 B i ) = n P (B i ). Pr construction pour tout i, B i A i, d où P (B i ) P (A i ) et finlement, ( n ) n n P A i = P (B i ) P (A i ). i=1 i=1 i=1 i=1 Preuve de 7 c). Posons pour tout n 1, D n = n i=1 A i, D = n 1 D n = i N A i. L suite (D n ) n 1 est croissnte et pour limite D. Donc d près 6 ), P (D n ) P (D) (n + ). D près 7 b) on : n n 1, P (D n ) P (A i ). Les deux membres de cette inéglité étnt les termes générux de deux suites croissntes de réels positifs, on obtient en pssnt à l limite qund n tend vers + : + P ( A i N i) = P (D) P (A i ). Ce qui prouve 7 c). Remrquons que les sommes prtielles de l série convergent dns R +. Bien sûr, l inéglité obtenue n d intérêt que lorsque l série de terme générl P (A i ) converge et une somme strictement inférieure à 1. i=1 i=1 66 Ch. Suquet, Cours I.P.É. 21
2.3. L probbilité comme mesure L vérifiction de l proposition 2.16 est mintennt complète. Remrque 2.17 (propriétés d une mesure). Les propriétés d une probbilité énoncées pr l proposition 2.16 s étendent à une mesure positive quelconque, vec les exceptions suivntes. L propriété 3 est vlble seulement pour µ(ω) fini en remplçnt 1 pr µ(ω). L propriété 5 est vrie à condition que µ(a B) soit fini. Pour l continuité séquentielle décroissnte 6 b), il fut rjouter l hypothèse µ(c ) < +. Le clcul de probbilités de réunions ou d intersections est une question crucile. L propriété 5 montre qu en générl on ne peut ps clculer P (A B) à prtir de l seule connissnce de P (A) et P (B) et qu on se heurte à l même difficulté pour P (A B). Le clcul des probbilités d intersections ser discuté plus trd, à propos du conditionnement. Pour les probbilités de réunions, on peut se demnder comment se générlise l propriété 5 lorsqu on réunit plus de deux évènements. Il est fcile de vérifier (fites-le!) que : P (A B C) = P (A)+P (B)+P (C) P (A B) P (A C) P (B C)+P (A B C). Le cs générl est donné pr l formule de Poincré qui exprime P (A 1 A n ) à l ide des probbilités de toutes les intersections des A i : 2 à 2, 3 à 3, etc. Proposition 2.18 (formule de Poincré). Pour tout entier n 2 et tous évènements A 1,..., A n : P ( n i=1 A i ) = n P (A i ) + i=1 n ( 1) k+1 k=2 1 i 1 <i 2 <...<i k n P (A i1 A ik ). (2.6) Preuve. On risonne pr récurrence 14. L formule est vrie pour n = 2, cr dns ce cs elle se réduit à P (A B) = P (A) + P (B) P (A B). (2.7) Supposons l formule de Poincré vrie u rng n (plus précisément on suppose que pour toute suite de n évènements A 1,..., A n, l églité (2.6) est vérifiée). Pour en déduire ( n+1 ) qu elle est lors vrie u rng n + 1, il nous fut clculer P A i. On commence pr i=1 ppliquer (2.7) vec A = n A i et B = A n+1. On obtient insi : i=1 ( n+1 ) P A i i=1 = P ( n i=1 A i ) + P (A n+1 ) P ([ n i=1 A i ] A n+1 ) = P ( n i=1 A i ) + P (A n+1 ) P ( n ) (A i A n+1 ). i=1 On pplique mintennt l hypothèse de récurrence (formule de Poincré (2.6)) d bord vec les n évènements A 1,..., A n puis vec les n évènements A 1,..., A n, où l on posé 14. Il y une utre méthode plus élégnte utilisnt l écriture d une probbilité comme espérnce d une fonction indictrice. Elle pourr être vue ultérieurement en exercice. Ch. Suquet, Cours I.P.É. 21 67
Chpitre 2. Événements et Probbilités A i := A i A n+1. Il vient : ( n+1 ) n P A i = P (A i ) + i=1 = i=1 + P (A n+1 ) n P (A i) + i=1 n ( 1) k+1 k=2 n ( 1) j+1 j=2 1 i 1 <i 2 <...<i k n 1 i 1 <i 2 <...<i j n P (A i1 A ik ) P (A i 1 A i j ) n+1 P (A i ) (2.8) i=1 n ( 1) k+1 k=2 1 i 1 <i 2 <...<i k n P (A i1 A ik ) (2.9) n + ( 1) 2+1 P (A i A n+1 ) (2.1) + n j=2 i=1 ( 1) (j+1)+1 1 i 1 <i 2 <...<i j n P (A i1 A ij A n+1 ) (2.11) Comprons ce résultt vec ce que l on espère trouver, c est-à-dire vec n+1 n+1 P (A i ) + ( 1) k+1 i=1 k=2 1 i 1 <i 2 <...<i k n+1 P (A i1 A ik ). } {{ } =:T n+1 Cel revient à vérifier que T n+1 est égl à l somme des lignes (2.9) à (2.11) ci-dessus. Prtgeons T n+1 en deux blocs comme suit. Le premier bloc regroupe tous les termes tels que i k < n + 1 (et donc i k n et k n). On le retrouve exctement à l ligne (2.9). Le deuxième bloc regroupe tous les termes pour lesquels i k = n + 1. Dns ce bloc, l somme des termes pour lesquels k = 2 se retrouve ligne (2.1). Il reste lors l somme des termes pour lesquels 3 k n + 1 et i k = n + 1 (donc i k 1 n). Cette somme est exctement le contenu de l ligne (2.11), comme on peut le voir en fisnt le chngement d indice k = j + 1 dns (2.11). Ceci chève l récurrence. 2.4 Exemples Nous exminons mintennt quelques exemples d espces probbilisés et de clcul de probbilités d évènements. Exemple 2.19. On effectue une prtie de pile ou fce en trois coups. Quelle est l probbilité d obtenir pile ux premier et troisième lncers? On peut modéliser cette expérience en prennt Ω = {f, p} 3 et pour fmille d événements observbles F = P(Ω) l ensemble de toutes les prties 15 de Ω. L pièce étnt 15. Lorsque Ω est fini, il est toujours possible de fire ce choix. 68 Ch. Suquet, Cours I.P.É. 21
2.4. Exemples supposée symétrique, nous n vons priori ps de rison de supposer que l un des 8 triplets de résultts possibles soit fvorisé ou défvorisé pr rpport ux utres. Nous choisirons donc P de sorte que tous les événements élémentires ient même probbilité (hypothèse d équiprobbilité), soit : ω Ω, P ({ω}) = 1 Crd Ω = 1 2 3. L événement B dont on veut clculer l probbilité s écrit : B = {(p,f,p); (p,p,p)}. D où : P (B) = 1 8 + 1 8 = 1 4. Exemple 2.2. On fit remplir un questionnire à 2 questions binires. Quelle est l probbilité qu un cndidt répondnt u hsrd obtienne u moins 16 bonnes réponses? On choisit ici : Ω = {oui, non} 2, F = P(Ω). Si le cndidt répond complètement u hsrd, on peut considérer que chcune des 2 2 grilles de réponses possibles l même probbilité d pprître (hypothèse d équiprobbilité sur Ω). Pour tout B Ω, on lors : P (B) = CrdB CrdΩ. En prticulier pour B = {obtention d u moins 16 bonnes réponses}, P (B) = C16 2 + C2 17 + C2 18 + C2 19 + C2 2 = 6196, 6. 2 2 2 2 Exemple 2.21 (contrôle de production). On prélève u hsrd un échntillon de k pièces dns une production totle de N pièces comprennt en tout n pièces défectueuses. Le prélèvement est sns remise (donc k N). Cherchons l probbilité de : A j = {il y exctement j pièces défectueuses dns l échntillon}. On prend pour Ω l ensemble de toutes les prties à k éléments d un ensemble à N éléments (ensemble de tous les échntillons possibles de tille k), F = P(Ω) et P l équiprobbilité sur Ω. Il suffit lors de dénombrer tous les échntillons ynt exctement j pièces défectueuses. Un tel échntillon se construit en prennt j pièces dns le sousensemble des défectueuses (Cn j choix possibles) et en complétnt pr k j pièces prises dns le sous-ensemble des non-défectueuses (C k j N n P (A j ) = Cj nc k j N n C k N si choix possibles). On en déduit : j n, j k, k j N n. Si l une de ces trois conditions n est ps vérifiée, P (A j ) =. Ch. Suquet, Cours I.P.É. 21 69
Chpitre 2. Événements et Probbilités Remrque 2.22. Lorsque Ω est fini, l fçon l plus simple de construire une probbilité sur (Ω, P(Ω)) est de choisir P ({ω}) = 1/ crd Ω. On prle lors d équiprobbilité ou de probbilité uniforme sur (Ω, P(Ω)). C est l modélistion qui s impose nturellement lorsqu on n ps de rison de penser priori qu un résultt élémentire de l expérience soit fvorisé ou défvorisé pr rpport ux utres. L sitution est rdiclement différente lorsque Ω est infini dénombrble. Sur un tel ensemble, il ne peut ps y voir d équiprobbilité. Imginons que l on veuille tirer une boule u hsrd dns une urne contennt une infinité de boules ynt chcune un numéro entier distinct (et une boule pr entier). Soit {ω i } l événement tirge de l boule numérotée i (i N) et p i s probbilité. Pr σ-dditivité, on doit toujours voir : p i = 1. i N Mis si tous les p i sont égux, l série ci-dessus contient une infinité de termes tous égux à p. S somme vut lors + si p > ou si p =, il y donc une contrdiction. Voici mintennt une crctéristion de toutes les probbilités sur les espces u plus dénombrbles. Proposition 2.23. Soit Ω = {ω i ; i I} un ensemble u plus dénombrble. L donnée d une probbilité sur (Ω, P(Ω)) équivut à l donnée d une fmille (p i ) i I dns R + telle que : p i = 1 et des églités i I P ({ω i }) = p i, i I. L probbilité P s écrit lors P = i I p iδ ωi, où δ ω désigne l msse de Dirc (ou mesure de Dirc) u point ω, définie sur P(Ω) pr δ ω (A) = 1 si ω A et δ ω (A) = si ω / A. Preuve. En préliminire, notons les fits suivnts reltifs ux mesures de Dirc sur Ω. ω Ω, δ ω (Ω) = 1. (2.12) i, j I, δ ωi ({ω j }) = { si i j, 1 si i = j. (2.13) Soit P une probbilité sur (Ω, P(Ω)). Comme l tribu P(Ω) possède les singletons, P ({ω}) est défini et fini (puisque mjoré pr 1). L mesure P est donc finie sur les singletons et d près l remrque 2.1, c est une mesure ponctuelle. Cel signifie qu il existe J I (donc u plus dénombrble) et une fmille {p i ) i J } de R + telle que P = i J p iδ ωi. On peut compléter cette écriture en posnt p i := pour i I \ J, pour obtenir P = p i δ ωi. (2.14) i I 7 Ch. Suquet, Cours I.P.É. 21
2.4. Exemples En écrivnt que P (Ω) = 1 et en utilisnt (2.12), il vient i I p i = 1. D utre prt on voit grâce à (2.13) que pour tout i I, P ({ω i }) = p i. Réciproquement, donnons nous une fmille (p i ) i I de réels positifs de somme 1 et définissons l mesure P pr (2.14). Grâce à (2.12), il est clir que P (Ω) = i I p i = 1, donc P est une probbilité. De plus pour tout i I, P ({ω i }) = p i en utilisnt (2.13). Exemple 2.24 (une probbilité définie sur ( N, P(N) ) ). Soit un réel strictement positif fixé. On pose : k N, p k = e k. k! On remrque que p k est le terme générl positif d une série convergente : + k= Pour tout A N, on définit : e k k! P (A) = k A = e + k= k k! = e e = 1. p k = k N p k δ k (A). D près l proposition 2.23, P est une probbilité sur (N, P(N)). On l ppelle loi de Poisson de prmètre. Clculons pr exemple P (2N) où 2N désigne l ensemble des entiers pirs. P (2N) = k 2N p k = + l= e 2l (2l)! = e ch = 1 2 (1 + e 2 ). Une conséquence de ce résultt est : si l on tire un nombre entier u hsrd suivnt une loi de Poisson, l probbilité qu il soit pir est strictement supérieure à 1 2. Exemple 2.25 (loi uniforme sur un segment). Prenons Ω = R, F = Bor(R) et rppelons que λ 1 désigne l mesure de Lebesgue sur R (cf. exemple 2.13). Soit [, b] un segment fixé de R. On définit une probbilité P sur (R, Bor(R)) en posnt : A Bor(R), P (A) = λ 1(A [, b]) λ 1 ([, b]) = λ 1(A [, b]). (2.15) b D près l exemple 2.12, P est une mesure et comme P (R) = 1, c est une probbilité. On l ppelle loi uniforme sur [, b]. Remrquons que pour cette probbilité, tout singleton est de probbilité nulle ( x R, P ({x}) = ), ce qui résulte de l propriété nlogue de λ 1. On voit sur cet exemple que l probbilité d une union infinie non dénombrble d évènements deux à deux disjoints n est ps forcément égle à l somme de l fmille correspondnte de probbilités d évènements. En effet, ( 1 = P ([, b]) = P x [,b] ) {x} P ({x}) =. x [,b] Ch. Suquet, Cours I.P.É. 21 71
Chpitre 2. Événements et Probbilités Exemple 2.26 (lois uniformes dns R d ). On peut générliser l exemple précédent en prennt u lieu d un segment un borélien B de R d, i.e. B Bor(R d ), tel que < λ d (B) < +. On définit lors une probbilité P sur (R d, Bor(R d )), en posnt : Cette probbilité est ppelée loi uniforme sur B. A Bor(R d ), P (A) = λ d(a B). (2.16) λ d (B) Nous llons donner mintennt une crctéristion de toutes les probbilités P sur (R, Bor(R)). Comme le montre l exemple de l loi uniforme sur un segment, il est illusoire d espérer crctériser ces probbilités pr les P ({x}). L sitution est donc rdiclement différente du cs d un espce Ω u plus dénombrble. Au lieu des P ({x}), nous llons utiliser les P (], b]), ou les P (], x]). Nous urons besoin pour cel de l notion de fonction de réprtition. Définition 2.27 (fonction de réprtition). Soit P une probbilité sur (R, Bor(R)). On ppelle fonction de réprtition de P, l ppliction F : R [, 1], x F (x) := P (], x]). y 1 F (c) F (c ) P ({c}) c x Fig. 2.3 Une fonction de réprtition vec une discontinuité u point x = c Voici les propriétés générles des fonctions de réprtition. Proposition 2.28. L fonction de réprtition F d une probbilité P sur (R, Bor(R)) les propriétés suivntes. ) F est croissnte sur R. b) F pour limite en et 1 en +. c) F est continue à droite sur R et une limite à guche en tout point x R. 72 Ch. Suquet, Cours I.P.É. 21
2.4. Exemples d) En notnt F (x ) := lim ε F (x ε) l limite à guche 16 u point x, on x R, P ({x}) = F (x) F (x ). (2.17) De plus l ensemble des x R tels que F (x) F (x ) est u plus dénombrble. e) Si deux probbilités P 1 et P 2 sur (R, Bor(R)) ont même fonction de réprtition F, elles sont égles, i.e. P 1 (B) = P 2 (B) pour tout B Bor(R). Preuve. Preuve du ). L croissnce de F sur R est une conséquence immédite de l croissnce de P pour l inclusion (prop. 2.16 4). En effet si x x, ], x] ], x ], d où F (x) = P (], x]) P (], x ]) = F (x ). Ainsi F est croissnte sur R. Il en résulte qu elle possède une limite à guche et une limite à droite en tout point x de R (cf. cours d nlyse). Preuve du b). Comme F est croissnte, elle dmet des limites en et +. On identifie l limite en (dont on connît l existence) grâce à une suite prticulière : lim F (x) = x lim F ( n) = n + lim P (], n]). n + On utilise l continuité séquentielle décroissnte de P, i.e. l proposition 2.16 7 b) vec B n =], n], en vérifint que : n N ], n] =. (2.18) En effet, soit x un élément de cette intersection. Alors x n pour tout n N donc en pssnt à l limite, x =, ce qui est impossible puisque x est un réel. Donc cette intersection est vide et lim n + P (], n]) = P ( ) =. L preuve de lim x + F (x) = 1 est nlogue et est lissée u lecteur. Preuve du c). Soit x R fixé. Comme on est ssuré de l existence de l limite à droite de F en ce point, pour montrer que cette limite vut F (x) et étblir l continuité à droite de F en x, il suffit de vérifier que : F (x) = lim n + F (x + 1/n). Comme F (x + 1/n) = P (], x + 1/n]), ceci résulte de l continuité séquentielle décroissnte de P ppliquée ux événements B n =], x + 1/n] en remrqunt que : n N ], x + 1 n ] =], x]. (2.19) En effet, pour tout y ], x], on y x x + 1/n pour tout n N et donc y n N B n d où ], x] est inclus dns l intersection des B n (n N ). Réciproquement tout y dns cette intersection vérifie : n N, y x + 1/n. Le pssge à l limite qund n tend vers l infini conservnt cette inéglité lrge, on en déduit y x soit encore y ], x]. Ainsi l intersection des B n, (n N ) est incluse dns ], x], ce qui chève l vérifiction de (2.19). 16. Cette nottion est un peu busive, puisqu il ne s git ps forcément d une vleur prise pr l fonction F. Attention à ne ps confondre le «x» dns F (x ) vec le «x» prtie négtive de x. Ch. Suquet, Cours I.P.É. 21 73
Chpitre 2. Événements et Probbilités Preuve du d). On remrque que pour tout x R et tout n N, P (]x 1 ]) (] n, x = P (], x]) P, x 1 ]) ( = F (x) F x 1 ). n n On vérifie d utre prt que : {x} = ]x 1 ] n N n, x. (2.2) En effet, le premier membre de (2.2) est clirement inclus dns le second. Réciproquement, si y est un élément quelconque de cette intersection, pour tout n N, x 1/n < y x, donc en pssnt à l limite qund n tend vers l infini, x y x d où y = x. Ceci termine l justifiction de (2.2). Comme on sit que F une limite à guche u point x, on en déduit pr continuité de P pour l suite décroissnte d événements B n =]x 1/n, x] : P ({x}) = (] lim P x 1 ]) n + n, x ( ) = lim F (x) F (x 1/n) = F (x) F (x ). n + Enfin, considérons l fmille de réels positifs { P ({x}), x R }. Pour toute prtie finie K de R, S K := x K P ({x}) = P (K) 1. Les sommes finies S K étnt insi uniformément bornées pr 1, l fmille est sommble pr l proposition 1.83 ). On sit qu lors l ensemble des éléments non nuls de cette fmille est u plus dénombrble, cf. proposition 1.85. Nous dmettrons le e), dont l preuve sort du progrmme de ce cours. Remrque 2.29. Les probbilités d intervlles s expriment fcilement à l ide de l fonction de réprtition. Il fut prendre grde ux extrémités. En générl on l églités suivntes pour une probbilité P sur (R, Bor(R)), de fonction de réprtition F, vec et b réels quelconques tels que < b, P (], b]) = F (b) F (), (2.21) P ([, b]) = F (b) F ( ), (2.22) P ([, b[) = F (b ) F ( ), (2.23) P (], b[) = F (b ) F (), (2.24) P (], [) = F ( ), (2.25) P (]b, + [) = 1 F (b), (2.26) P ([b, + [) = 1 F (b ). (2.27) Ces formules n ont ps à être pprises pr coeur. Elles se retrouvent vec un peu de réflexion. Elles se simplifient lorsque F est continue en ou b. En prticulier si F est continue ux points et b, les 4 intervlles d extrémités et b ont même probbilité. 74 Ch. Suquet, Cours I.P.É. 21
2.5. Remrques sur le choix d un modèle Nous dmettrons le théorème suivnt qui permet de construire toutes les probbilités sur (R, Bor(R)). Théorème 2.3. Soit F une fonction croissnte et continue à droite sur R, ynt pour limite en et 1 en +. Il existe une unique probbilité P sur (R, Bor(R)) telle que, b R, vec b, P (], b]) = F (b) F (). Alors F est l fonction de réprtition de P. 2.5 Remrques sur le choix d un modèle Envisgeons l sitution suivnte «on jette deux dés...». Un événement élémentire ssocié à cette expérience est l sortie de deux nombres entiers distincts ou non compris entre 1 et 6. Une première modélistion consiste à choisir Ω = {1, 2, 3, 4, 5, 6} 2, à prendre comme ensemble d événements 1 2 3 4 5 6 observbles F = P(Ω) et à ttribuer à chque événement élémentire {(i, j)} l probbilité 1/36 (modèle (1)). Il est 1 2 A commode de représenter Ω sous l forme d un tbleu à 3 A 36 cses correspondnt chcune à un événement élémentire. 4 On peut lors définir l probbilité comme un rp- 5 6 B port d ires (modèle (1 Aire de B )) : P (B) =. Ce modèle Aire de Ω (1) ou (1 ) est ccepté d utnt plus fcilement qu on ur précisé que les deux dés sont distingubles (pr exemple un dé rouge et un vert, ou deux dés blncs lncés chcun Fig. 2.4 Modèle (1 ) sur une tble différente). On peut insi distinguer l événement A = {(2, 3)} de l événement A = {(3, 2)} où l première composnte désigne le résultt du dé rouge. Aux questions : quelle est l probbilité de l évènement A := {obtenir un 2 et un 3}, quelle est celle de l évènement B := {obtenir un double 6}? On répondr nturellement : P (A) = P ({A A ) = 1 36 + 1 36 = 1 18 et P (B) = P ({(6, 6)}) = 1 36. Supposons mintennt que les deux dés ne sont plus distingubles, pr exemple jet de deux dés blncs sur une même tble ou jet de deux dés de couleurs différentes, l observtion étnt notée sns tenir compte de l couleur. Voici une modélistion possible. On ne considère comme fmille F d événements observbles que les prties symétriques de Ω ( i.e. invrintes pr (i, j) (j, i)). Cel revient à remplcer Ω = {1,..., 6} 2 pr l ensemble Ω, dont les éléments (et donc les événements élémentires) sont de deux types : les doubles et les pires de deux chiffres distincts. Alors F = P( Ω) est constituée de 2 21 événements, ce modèle est moins riche en informtion que le précédent (2 36 événements). On peut risonnblement penser que l couleur n influe ps sur les résultts et ttribuer pour rester cohérent vec notre première modélistion l probbilité 1/36 Ch. Suquet, Cours I.P.É. 21 75
Chpitre 2. Événements et Probbilités ux doubles et 1/18 ux pires de deux chiffres distincts. On voit insi un exemple de sitution pourtnt très simple où il n y ps équiprobbilité des événements élémentires (modèle (2)). Remrquons là ussi que l on peut donner une représenttion géométrique de ce modèle en replint le crré le long de s digonle i = j. Les événements élémentires sont mintennt représentés pr un crré ou un tringle et leur probbilité est définie comme un rpport d ires, il s git de l loi uniforme sur le tringle rectngle de côté 6 (modèle (2 )). 1 2 3 4 5 6 1 2 3 4 5 6 Fig. 2.5 Modèle (2 ) Un troisième modèle peut être proposé et il ser souvent dopté implicitement pr des débutnts à qui on ur dit : on jette deux dés de même couleur... On considère 21 événements élémentires : les 6 doubles et les 15 pires à deux chiffres distincts 17. Ω = {1, 2,..., 6, 12,..., 16, 23,... 26, 34,..., 56} } {{ } } {{ } doubles distincts On prend comme ensemble d événements observbles F = P(Ω) ensemble des prties de Ω. On définit l probbilité P pr l hypothèse d équiprobbilité (modèle (3)). On obtient 1 2 3 4 5 6 1 2 3 4 5 6 Fig. 2.6 Modèle (3 ) une représenttion géométrique équivlente à l ide de l figure 2.6. Les événements élémentires sont représentés pr un crré et l probbilité est définie comme un rpport d ires (modèle (3 )). Avec ce modèle, l probbilité d obtenir un double six est l même que celle d obtenir un deux et un trois et vut 1 21. On peut imginer toute une liste d excellents rguments qui militent en fveur des modèles (1) et (2) contre le modèle (3), pr exemple : «on jette deux dés de couleurs différentes et on les filme vec deux cmérs, une couleur et l utre noir et blnc...», «il y deux fçons d obtenir 2 et 3 et une seule de fire un double 6». Tous ces rguments relèvent d une nlyse priori de l expérience et ps de l théorie mthémtique des probbilités. Chcun des modèles présentés ci-dessus s cohérence comme objet mthémtique. L question pertinente est : prmi ces modèles, lequel (lesquels?) représente(nt) le mieux l rélité? Pour un physicien, ce qui fit l vleur d un modèle est s cpcité à permettre l prévision du résultt d expériences. Ainsi certines expériences sont «expliquées» pr 17. L pire «1 et 2» est notée «12»,... 76 Ch. Suquet, Cours I.P.É. 21
2.6. Probbilités conditionnelles l théorie de l reltivité lors que leur résultt ne s ccorde ps vec l théorie de l mécnique clssique. Si l on se plce dns le cdre des modèles (1) et (2), l loi forte des grnds nombres nous dit que si l on jette les dés une infinité de fois, l fréquence d pprition du double six v converger 18 vers 1 1 tndis qu vec le modèle (3) cette fréquence converger vers. L 36 21 rélistion d un grnd nombre de lncers permet donc ici de constter que les modèles (1) et (2) rendent mieux compte de l rélité que le (3). Une question importnte est lors : que fut-il entendre pr grnd nombre? Cette question ser discutée ultérieurement. 2.6 Probbilités conditionnelles 2.6.1 Introduction Comment doit-on modifier l probbilité que l on ttribue à un événement lorsque l on dispose d une informtion supplémentire? Le concept de probbilité conditionnelle permet de répondre à cette question. Pr exemple, une fédértion d escrime regroupe N licenciés, dont N H hommes et N F = N N H femmes. Il y N G guchers (des deux sexes) prmi tous les licenciés. On choisit un individu u hsrd. Notons : G = {l individu choisi u hsrd est gucher} H = {l individu choisi u hsrd est un homme} On note N G H le nombre d escrimeurs hommes guchers. On bien sûr : P (H) = N H /N et P (G H) = N G H /N. Quelle est l probbilité qu un licencié homme choisi u hsrd soit gucher? On dispose ici d une informtion supplémentire : on sit que l individu choisi est un homme. En considérnt les divers choix possibles d un homme comme équiprobbles, l probbilité cherchée est clirement : N G H /N H. Ceci s exprime ussi à l ide de P (H) et de P (G H) en remrqunt que : N G H N H = NP (G H) NP (H) = P (G H). P (H) Pr nlogie, nous donnons dns le cs générl l définition formelle : Définition 2.31 (probbilité conditionnelle). Soit H un événement tel que P (H). Pour tout événement A, on définit : P (A H) = P (A H), P (H) ppelée probbilité conditionnelle de l événement A sous l hypothèse H. 18. En un sens qui ser précisé dns le chpitre sur l loi des grnds nombres. Ch. Suquet, Cours I.P.É. 21 77
Chpitre 2. Événements et Probbilités Remrquons que pour l instnt, il ne s git que d un jeu d écriture. On simplement défini un réel P (A H) pour que : P (A H) = P (A H)P (H). Ce qui fit l intérêt du concept de probbilité conditionnelle, c est qu il est souvent bien plus fcile d ttribuer directement une vleur à P (A H) en tennt compte des conditions expérimentles (liées à l informtion H) et d en déduire ensuite l vleur de P (A H). Le risonnement implicite lors utilisé est : tout espce probbilisé modélisnt correctement l rélité expérimentle devrit fournir telle vleur pour P (A H)... Exemple 2.32. Une urne contient r boules rouges et v boules vertes. On en tire deux l une près l utre, sns remise. Quelle est l probbilité d obtenir deux rouges? Notons H et A les événements : H = {rouge u 1 er tirge}, A = {rouge u 2 e tirge}. Un espce probbilisé (Ω, F, P ) modélisnt correctement cette expérience devrit vérifier : P (H) = r r + v, P (A H) = r 1 r + v 1. En effet, si H est rélisé, le deuxième tirge lieu dns une urne contennt r + v 1 boules dont r 1 rouges. On en déduit : P (deux rouges) = P (A H) = P (A H)P (H) = r 1 r + v 1 r r + v. On urit pu rriver u même résultt en prennt pour Ω l ensemble des rrngements de deux boules prmi r + v, muni de l équiprobbilité et en fisnt du dénombrement : d où : crd Ω = A 2 r+v = (r + v)(r + v 1), crd(a H) = A 2 r = r(r 1). P (A H) = Notons d illeurs que crd H = r(r + v 1) d où r(r 1) (r + v)(r + v 1). P (H) = crd H crd Ω = r(r + v 1) (r + v)(r + v 1) = r r + v. En ppliqunt l définition formelle de P (A H) on retrouve : P (A H) = P (A H) P (H) = r(r 1) (r + v)(r + v 1) r + v r = r 1 r + v 1, ce qui est bien l vleur que nous vions ttribuée priori en nlysnt les conditions expérimentles. 78 Ch. Suquet, Cours I.P.É. 21
2.6. Probbilités conditionnelles Remrque 2.33. Il importe de bien comprendre que l écriture «A H» ne désigne ps un nouvel événement 19 différent de A. Qund on écrit P (A H), ce que l on modifié, ce n est ps l événement A, mis l vleur numérique qui lui étit ttribuée pr l fonction d ensembles P. Il serit donc en fit plus correct d écrire P H (A) que P (A H). On conserver nénmoins cette dernière nottion essentiellement pour des risons typogrphiques : P (A H 1 H 2 H 3 ) est plus lisible que P H1 H 2 H 3 (A). 2.6.2 Propriétés Proposition 2.34. Soit (Ω, F, P ) un espce probbilisé et H un événement fixé tel que P (H). Alors l fonction d ensembles P (. H) définie pr : est une nouvelle probbilité sur (Ω, F). P (. H) : F [, 1] B P (B H) L preuve déjà été donnée à l occsion de l exemple 2.12. Une conséquence immédite est que l fonction d ensembles P (. H) vérifie toutes les propriétés de l proposition 2.16. Corollire 2.35. L fonction d ensembles P (. H) vérifie : 1. P ( H) =, P (Ω H) = 1 et si A H, P (A H) = 1. 2. Si les A i sont deux à deux disjoints : P ( n i=1 A i H) = n P (A i H). i=1 3. Pour tout B F, P (B c H) = 1 P (B H). 4. Pour tous A F et B F, si A B, P (A H) P (B H). 5. Pour tous A F et B F, P (A B H) = P (A H) + P (B H) P (A B H). 6. Pour toute suite (A i ) i 1 d événements : P ( A i H ) + P (A i N i H). i=1 7. Si B n B, P (B n H) P (B H), (n + ). 8. Si C n C, P (C n H) P (C H), (n + ). 19. En fit cette écriture prise isolément (sns le P ) n ps de sens et ne devrit jmis être utilisée. Le symbole ne représente ps une opértion sur les événements qui l entourent. Ch. Suquet, Cours I.P.É. 21 79
Chpitre 2. Événements et Probbilités Nous n vons vu jusqu ici ucune formule permettnt de clculer l probbilité d une intersection d événements à l ide des probbilités de ces événements. Une telle formule n existe ps dns le cs générl. Les probbilités conditionnelles fournissent une méthode générle tout à fit nturelle pour clculer une probbilité d intersection. Proposition 2.36 (règle des conditionnements successifs). Si A 1,..., A n sont n événements tels que P (A 1... A n 1 ), on : P (A 1... A n ) = P (A 1 )P (A 2 A 1 )P (A 3 A 1 A 2 ) Preuve. Pour 1 i n 1, on n 1 A j i A j d où : j=1 j=1 ( n 1 ) ( < P A i ) j P A j. j=1 j=1 P (A n A 1... A n 1 ). Donc P ( i j=1 A j ) n est nul pour ucun i n 1 et on peut conditionner pr l événement i j=1 A j. Ceci légitime le clcul suivnt : P (A 1 )P (A 2 A 1 )P (A 3 A 1 A 2 ) P (A n A 1... A n 1 ) = P (A 1 ) P (A 1 A 2 ) P (A 1 A 2 A 3 ) P (A 1... A n ) P (A 1 ) P (A 1 A 2 ) P (A 1... A n 1 ) = P (A 1... A n ), près simplifictions en chîne de toutes ces frctions. Les probbilités conditionnelles permettent ussi de clculer l probbilité d un événement en conditionnnt pr tous les cs possibles. Du point de vue ensembliste, ces cs possibles correspondent à une prtition de Ω. Définition 2.37 (prtition). On dit qu une fmille (H i ) i I de prties de Ω est une prtition de Ω si elle vérifie les trois conditions : i I, H i. Ω = H i. i I Les H i sont deux à deux disjoints (i j H i H j = ). Proposition 2.38 (conditionnement pr les cs possibles 2 ). (i) Si H est tel que P (H) et P (H c ), on 2. ou formule des probbilités totles. A F, P (A) = P (A H)P (H) + P (A H c )P (H c ). 8 Ch. Suquet, Cours I.P.É. 21
2.6. Probbilités conditionnelles (ii) Si H 1,..., H n est une prtition finie de Ω en événements de probbilité non nulle, A F, P (A) = n P (A H i )P (H i ). i=1 (iii) Si (H i ) i N est une prtition de Ω telle que i N, P (H i ) : A F, P (A) = + i= P (A H i )P (H i ). Preuve. Il suffit de vérifier (iii), les deux premières propriétés se démontrnt de fçon nlogue. Comme (H i ) i N est une prtition de Ω, A = A Ω = A ( i N H i ) = i N (A H i ) et cette réunion est disjointe cr les H i étnt deux à deux disjoints, il en est de même pour les (A H i ). Pr conséquent pr σ-dditivité : P (A) = + i= P (A H i ) = + i= P (A H i )P (H i ). Lorsqu on une prtition de Ω en n hypothèses ou cs possibles H i et que l on sit clculer les P (H i ) et les P (A H i ), on peut se poser le problème inverse : clculer P (H j A) à l ide des quntités précédentes. L solution est donnée pr l formule suivnte quelquefois ppelée (busivement) formule des probbilités des cuses. Proposition 2.39 (formule de Byes). Soit A un événement de probbilité non nulle. Si les événements H i (1 i n) forment une prtition de Ω et si ucun P (H i ) n est nul, on pour tout j = 1,..., n : P (H j A) = P (A H j)p (H j ) n i=1 P (A H i)p (H i ). Preuve. Pr définition des probbilités conditionnelles on : P (H j A) = P (A H j) P (A) = P (A H j)p (H j ). P (A) Et il ne reste plus qu à développer P (A) en conditionnnt pr l prtition (H i, 1 i n) comme à l proposition 2.38. L même formule se générlise u cs d une prtition dénombrble. Ces formules sont plus fciles à retrouver qu à mémoriser... Ch. Suquet, Cours I.P.É. 21 81
Chpitre 2. Événements et Probbilités 2.6.3 Quelques exemples Exemple 2.4. On considère deux urnes U 1 et U 2. L urne U 1 contient r 1 boules rouges et v 1 boules vertes. L urne U 2 contient r 2 boules rouges et v 2 boules vertes. On lnce un dé. S il indique le chiffre 1, on choisit l urne U 1, sinon on choisit U 2. Dns chque cs on effectue deux tirges vec remise dns l urne choisie. Quelle est l probbilité d obtenir une rouge u premier tirge? deux rouges en tout? Adoptons les nottions d événements suivntes : R = {rouge u 1 er tirge}, R = {rouge u 2 e tirge}, H 1 = {choix de l urne U 1 }, H 2 = H c 1 = {choix de l urne U 2 }. Il est fcile de clculer directement P (R H i ) et P (R R H i ) pour i = 1, 2. En effet, une fois l urne U i choisie, on un problème clssique de tirges vec remise dns l même urne que l on peut triter (pr exemple) pr le dénombrement. On insi : P (R H i ) = r ( i, P (R R ri ) 2. H i ) = r i + v i r i + v i L formule de conditionnement pr l prtition {H 1, H 2 } donne : et P (R) = P (R H 1 )P (H 1 ) + P (R H 2 )P (H 2 ) = 1 r 1 + 5 r 2 6 r 1 + v 1 6 r 2 + v 2 P (R R ) = P (R R H 1 )P (H 1 ) + P (R R H 2 )P (H 2 ) = 1 ( r1 ) 2 5 ( r2 ) 2. + 6 r 1 + v 1 6 r 2 + v 2 Exemple 2.41. Un questionnire à choix multiples propose m réponses pour chque question. Soit p l probbilité qu un étudint connisse l réponse à une question donnée. S il ignore l réponse, il choisit u hsrd l une des réponses proposées. Quelle est pour le correcteur l probbilité qu un étudint connisse vriment l bonne réponse lorsqu il l donnée? Notons : B = {l étudint donne l bonne réponse} C = {l étudint connît l bonne réponse} On cherche P (C B). Avec ces nottions, les données de l énoncé peuvent se trduire pr : P (C) = p, P (C c ) = 1 p, P (B C) = 1, P (B C c ) = 1 m. 82 Ch. Suquet, Cours I.P.É. 21
2.6. Probbilités conditionnelles On en déduit : P (C B) = = = P (B C) P (B) P (B C)P (C) P (B C)P (C) + P (B C c )P (C c ) 1 p 1 p + 1 (1 p) = mp 1 + (m 1)p. m Pour p fixé, P (C B) est une fonction croissnte de m, les deux bornes étnt P (C B) = p (cs m = 1) et P (C B) 1 (m + ). D utre prt pour m fixé, P (C B) est une fonction croissnte de p. On pour p > : P (C B) p = m 1 + (m 1)p 1, l églité n étnt possible que pour p = 1. Tout ceci est conforme à l intuition. Exemple 2.42. Un test snguin une probbilité de,95 de détecter un certin virus lorsque celui-ci est effectivement présent. Il donne nénmoins un fux résultt positif pour 1% des personnes non infectées. Si,5% de l popultion est porteuse du virus, quelle est l probbilité qu une personne it le virus schnt qu elle un test positif? Notons V = {l personne testée le virus}, T = {l personne testée un test positif}. On cherche P (V T ). Or on sit que P (V ) =,5, P (T V ) =,95 et P (T V c ) =,1. On en déduit : P (V T ) = P (T V ) P (T ) = = P (T V )P (V ) P (T V )P (V ) + P (T V c )P (V c ),95,5,95,5 +,1,995,323. On voit insi que contrirement à ce que l on urit pu croire, le test n est ps fible : si l personne présente un test positif, l probbilité qu elle ne soit ps porteuse du virus est deux fois plus élevée que celle qu elle le soit! Exemple 2.43. Revenons sur le problème de dés étudié à l sous-section 2.2.3, i.e. ttribution d une probbilité à l évènement E première obtention de l somme 9 vnt celle de l somme 7. Les probbilités conditionnelles permettent d en proposer une solution simple, sns clcul de série. En rppelnt que F 1, G 1, H 1 désignent respectivement l évènement obtention u premier lncer d une somme 9 (resp. 7, resp. ni 7 ni 9), l formule des probbilités totles nous donne : P (E) = P (E F 1 )P (F 1 ) + P (E G 1 )P (G 1 ) + P (E H 1 )P (H 1 ). (2.28) Ch. Suquet, Cours I.P.É. 21 83
Chpitre 2. Événements et Probbilités On clirement P (E F 1 ) = 1 et P (E G 1 ) =. Pour ttribuer une vleur à P (E H 1 ), on considère que l obtention d une somme utre que 7 ou 9 u premier lncer ne devrit ps influer sur l pprition ultérieure du 7 ou du 9. Pour trduire cette idée, on pose P (E H 1 ) = P (E). En reportnt ces vleurs dns (2.28), il vient P (E) = P (F 1 ) + P (E)P (H 1 ) = 1 9 + 13 18 P (E), d où ( ce qui se résout en 1 13 18 ) P (E) = 1 9, P (E) = 1 9 18 5 = 2 5. On retrouve insi l vleur obtenue à l sous-section 2.2.3, lorsque nous vons esquissé l construction d un espce (Ω, F, P ) modélisnt cette expérience létoire. Le point clé dns le risonnement ci-dessus est l églité P (E H 1 ) = P (E), qui exprime l indépendnce des évènements H 1 et E, une notion que nous llons étudier mintennt. 2.7 Indépendnce 2.7.1 Indépendnce de deux événements Soient A et B deux événements de probbilité non nulle. Il rrive que l connissnce de l rélistion de A ne modifie ps notre informtion sur celle de B, utrement dit que P (B A) = P (B). C est le cs pr exemple lorsque l on fit un tirge vec remise et que l rélistion de A ne dépend que du résultt du premier tirge, celle de B que du deuxième. Symétriquement on ur dns cet exemple P (A B) = P (A). Cette remrque se générlise : Proposition 2.44. Si A et B sont des événements de probbilité non nulle, les trois églités suivntes sont équivlentes : (i) P (B A) = P (B), (ii) P (A B) = P (A), (iii) P (A B) = P (A)P (B). Preuve. Comme P (A) et P (B), on l chîne d équivlences : P (A B) P (A) = P (B) P (A B) = P (A)P (B) P (A B) P (B) = P (A). D utre prt l reltion (iii) est toujours vérifiée dns le cs dégénéré où P (A) = ou P (B) =. En effet, on lors à l fois P (A)P (B) = et P (A B) min ( P (A), P (B) ) = d où P (A B) =. Ainsi l reltion (iii) est un peu plus générle que (i) et (ii). Elle ussi sur les deux utres l vntge de l symétrie d écriture. C est elle que l on retient pour définir l indépendnce. 84 Ch. Suquet, Cours I.P.É. 21
2.7. Indépendnce Définition 2.45. Soit (Ω, F, P ) un espce probbilisé. Deux événements A et B de cet espce sont dits indépendnts lorsque : P (A B) = P (A)P (B). Exemple 2.46. On jette deux fois le même dé. Les événements A = {obtention d un chiffre pir u premier lncer}, B = {obtention du 1 u deuxième lncer}, sont indépendnts. En effet, en prennt Ω = {1, 2,..., 6} 2, F = P(Ω) et P l équiprobbilité, on vérifie que : P (A) = 3 6 36 P (A B) = 3 1 36 = 1 2, P (B) = 6 1 36 = 1 6, = 1 12, P (A)P (B) = 1 2 1 6 = 1 12. Remrques 2.47. Si A est un événement tel que P (A) = ou P (A) = 1, lors il est indépendnt de tout événement, y compris de lui-même (c est le cs en prticulier pour Ω et ). Deux événements incomptibles A et B vec P (A) > et P (B) > ne sont jmis indépendnts. En effet A B = implique P (A B) = or P (A)P (B). L indépendnce de deux événements A et B n est ps une propriété intrinsèque ux événements, elle est toujours reltive u modèle (Ω, F, P ) que l on choisi. Voici un exemple pour l illustrer. Exemple 2.48. Une urne contient 12 boules numérotées de 1 à 12. On en tire une u hsrd et on considère les événements : A = {tirge d un nombre pir}, B = {tirge d un multiple de 3}. L espce probbilisé qui s impose nturellement ici est Ω = {1,..., 12} muni de l équiprobbilité P. Les événements A et B s écrivent : Dns ce modèle, on A = {2, 4, 6, 8, 1, 12}, B = {3, 6, 9, 12}, A B = {6, 12}. P (A) = 6 12 = 1 2, P (B) = 4 12 = 1 3, donc A et B sont indépendnts. P (A B) = 2 12 = 1 6, P (A)P (B) = 1 2 1 3 = 1 6, Ch. Suquet, Cours I.P.É. 21 85
Chpitre 2. Événements et Probbilités On rjoute mintennt dns l urne une boule numérotée treize et on recommence l expérience. Les événements A et B restent les mêmes, mis le modèle chngé. On mintennt l équiprobbilité P sur Ω = {1,..., 13} et P (A) = 6 13, P (B) = 4 13, P (A B) = 2 13, mis P (A)P (B) = 6 13 4 13 = 24 169 2 13, donc A et B ne sont plus indépendnts. Un peu de réflexion permet de relier ces résultts clcultoires vec l notion intuitive d indépendnce présentée en introduction. Dns le premier cs, l proportion des multiples de trois prmi les pirs est l même que prmi les impirs. Le fit de svoir que l boule tirée est pire ne modifie en rien notre informtion sur B. Pr contre dns le deuxième cs, l jout de l treizième boule modifie l proportion des multiples de trois : elle est plus élevée chez les pirs que chez les impirs. Donc le fit de svoir que l boule tirée est pire ugmente un peu l probbilité que nous pouvons ttribuer à B. Proposition 2.49. Si A et B sont indépendnts, il en est de même pour les pires d événements A et B c, A c et B, A c et B c. Preuve. Pr hypothèse, P (A B) = P (A)P (B). En considérnt l réunion disjointe A = (A B) (A B c ), nous vons : P (A B c ) = P (A) P (A B), d où : P (A B c ) = P (A) P (A)P (B) = P (A) ( 1 P (B) ) = P (A)P (B c ). Donc A et B c sont indépendnts. L échnge des rôles de A et B dns ce risonnement donne l indépendnce de A c et B. En réutilisnt le premier résultt vec A c à l plce de A, on obtient lors celle de A c et B c. 2.7.2 Indépendnce mutuelle On se propose de générliser l notion d indépendnce à plus de deux événements. Exminons d bord l sitution suivnte. Exemple 2.5. Une urne contient qutre jetons : un bleu, un blnc, un rouge et un bleu-blnc-rouge. On en tire un u hsrd. Considérons les trois événements A = {le jeton tiré contient du bleu}, B = {le jeton tiré contient du blnc}, C = {le jeton tiré contient du rouge}. Il est clir que P (A) = P (B) = P (C) = 2/4 = 1/2. D utre prt : P (A B) = P (tricolore) = 1 4 = P (A)P (B) 86 Ch. Suquet, Cours I.P.É. 21
2.7. Indépendnce et de même P (B C) = 1/4 = P (B)P (C), P (C A) = 1/4 = P (C)P (A). Ainsi les événements A, B, C sont deux à deux indépendnts. D utre prt P (A B C) = 1 cr B C = {tricolore}. Donc l connissnce de l rélistion simultnée de B et C modifie notre informtion sur A. L notion d indépendnce deux à deux n est donc ps suffisnte pour trduire l idée intuitive d indépendnce de plusieurs événements. Ceci motive l définition suivnte. Définition 2.51. Trois événements A, B, C sont dits mutuellement indépendnts lorsqu ils vérifient les qutre conditions : P (A B) = P (A)P (B), P (B C) = P (B)P (C), P (C A) = P (C)P (A), P (A B C) = P (A)P (B)P (C). Avec cette définition de l indépendnce des événements A, B et C on bien 21 P (A B) = P (A), P (A B C) = P (A), insi que toutes les églités qui s en déduisent pr permuttion sur les lettres A, B, C. On peut générliser cette définition comme suit. Définition 2.52. Les n événements A 1,..., A n sont dits mutuellement indépendnts si pour toute sous-fmille A i1,..., A ik vec 1 i 1 <... < i k n, on : P (A i1... A ik ) = P (A i1 ) P (A ik ). (2.29) L indépendnce mutuelle implique évidemment l indépendnce deux à deux et l réciproque est fusse comme le montre l exemple 2.5. Dns toute l suite, lorsque nous prlerons d une fmille de plusieurs événements indépendnts sns utre précision, nous sous-entendrons systémtiquement mutuellement indépendnts. Proposition 2.53. Si {A 1,..., A n } est une fmille de n événements indépendnts, toute fmille obtenue en remplçnt certins des A i pr leur complémentire est encore indépendnte. Preuve. Supposons l proposition démontrée dns le cs où l on remplcé un seul A i pr son complémentire. Le cs générl s en déduit en utilisnt cette propriété utnt de fois qu il y de A i chngés en leur complémentire. Dns le cs d un seul A i remplcé, on ne perd ps de générlité en supposnt qu il s git de A 1 (il suffit de chnger l indextion des événements, ce qui n ffecte ps leur indépendnce mutuelle). Il nous reste lors à vérifier (2.29) dns le cs où i 1 = 1 vec A c i 1 à l plce de A i1 (dns le cs i 1 > 1, l églité ne fit intervenir que des éléments de l fmille initile et il n y donc rien à vérifier). Posons B = A i2 A ik. L hypothèse (2.29) ppliquée à l fmille A i2..., A ik nous donne P (B) = P (A i2 ) P (A ik ). L même hypothèse ppliquée à A i1..., A ik nous donne lors l indépendnce de A i1 et de B. Pr l proposition 2.49, on en déduit : P (A c i 1 B) = P (A c i 1 ) P (B) = P (A c i 1 ) P (A i2 ) P (A ik ), ce qui chève l preuve. 21. Lorsque les probbilités conditionnelles existent. Ch. Suquet, Cours I.P.É. 21 87
Chpitre 2. Événements et Probbilités Définition 2.54 (indépendnce d une suite d évènements). Une suite infinie d événements est dite indépendnte si toute sous-suite finie est formée d événements mutuellement indépendnts. Remrque 2.55. Compte-tenu de l proposition 2.53, on voit imméditement que si (A i ) i N est une suite indépendnte d évènements, toute suite formée en remplçnt certins des A i (éventuellement tous) pr leur complémentire est encore indépendnte. 2.7.3 Épreuves répétées Considérons une suite d épreuves rélisées dns les mêmes conditions expérimentles. Pr exemple tirges vec remise dns l même urne, lncers successifs d un dé,... Il est lors risonnble de supposer que les résultts de tout sous-ensemble fini d épreuves n ont ucune influence sur ceux des utres épreuves. Définition 2.56. On dit que les épreuves sont indépendntes si toute suite (A i ) i 1 telle que l rélistion de chque A i est déterminée uniquement pr le résultt de l i e épreuve est une suite indépendnte d événements. Exemple 2.57. On rélise une suite d épreuves indépendntes. Chque épreuve résulte en un succès vec probbilité p ], 1[ ou en un échec vec probbilité q = 1 p. Quelle est l probbilité des événements suivnts : ) A = {Au moins un succès u cours des n premières épreuves}, b) B = {Exctement k succès u cours des n premières épreuves}, c) C = {Toutes les épreuves donnent un succès}? Notons pour tout i 1 : R i = {succès à l i e épreuve}, Ri c est lors l échec à l i e épreuve. ) A = n R i, d où A c = n R c i=1 i=1 i. Les Ri c étnt indépendnts, on : P (A c ) = n P (Ri) c = (1 p) n = q n. i=1 On en déduit P (A) = 1 q n. b)tritons d bord le cs < k < n. L événement B est l réunion disjointe de tous les événements du type : ( ) ( ) B I = R i i I j J Rc j, où I est une prtie de crdinl k de {1,..., n} et J son complémentire dns {1,..., n}. L ensemble d indices I représente un choix possible des k épreuves donnnt un succès, les utres épreuves indexées pr J donnnt lors un échec. En considérnt tous les choix possibles de l ensemble I (il y en C k n), on obtient une prtition de B pr les B I. Pr indépendnce des épreuves, pour tout I on : P (B I ) = i I P (R i ) j J P (R c j) = p k q n k. 88 Ch. Suquet, Cours I.P.É. 21
2.7. Indépendnce On voit insi que P (B I ) ne dépend ps de I. On en déduit : P (B) = I {1,...,n} P (B I ) = Cnp k k q n k. crd I=k L vérifiction de l vlidité de l formule P (B) = C k np k q n k dns les cs k = et k = n est lissée u lecteur. c) Pour n 1, soit C n = {succès ux n premières épreuves}. Clirement C est inclus dns C n donc P (C) P (C n ). En utilisnt l indépendnce des R i on obtient : P (C n ) = P ( n i=1 R i ) = n P (R i ) = p n. donc pour tout n 1, P (C) p n. En fisnt tendre n vers +, on en déduit P (C) =. i=1 Ch. Suquet, Cours I.P.É. 21 89
Chpitre 2. Événements et Probbilités 9 Ch. Suquet, Cours I.P.É. 21
Chpitre 3 Vribles létoires 3.1 Introduction Dns de nombreux jeux, on fit intervenir le hsrd en observnt l somme des points mrqués pr deux dés. Considérons le jet d un dé bleu et d un dé rouge et notons S l somme des points obtenus. On modélise cette expérience en prennt l équiprobbilité sur : Ω = {1, 2, 3, 4, 5, 6} 2. Un événement élémentire ω est ici un couple (b, r) où b désigne le résultt du dé bleu et r celui du rouge et S(ω) = b + r. Il est commode de décrire l sitution pr un tbleu à 36 cses en écrivnt l vleur de S(ω) dns l cse représentnt ω = (b, r) à l intersection de l ligne b et de l colonne r. 1 2 3 4 5 6 1 2 3 4 5 6 7 2 3 4 5 6 7 8 3 4 5 6 7 8 9 4 5 6 7 8 9 1 5 6 7 8 9 1 11 6 7 8 9 1 11 12 Fig. 3.1 Somme des points de deux dés On insi défini une ppliction S de Ω dns l ensemble des sommes de points possibles : {2, 3,..., 11, 12}. On dit que S est une vrible létoire sur Ω. En fit, l observtion qui nous intéresse dns cette expérience, ce n est ps ω, mis seulement S(ω). Ce que l on imerit connître, c est l probbilité que l somme des points prenne une vleur donnée, soit P (S = k) pour k entier fixé entre 2 et 12. Ici l nottion 91
Chpitre 3. Vribles létoires «P (S = k)» est un bus d écriture commode pour désigner P ( {ω Ω; S(ω) = k} ). En utilisnt l équiprobbilité sur Ω et l figure 3.1, nous obtenons le tbleu 3.1. k 2 3 4 5 6 7 8 9 1 11 12 P (S = k) 1 36 2 36 3 36 4 36 Tb. 3.1 Probbilités des vleurs de l somme des points Cel revient à considérer un nouvel ensemble d événements élémentires : 5 36 6 36 5 36 4 36 3 36 Ω = S(Ω) = {2, 3, 4, 5, 6, 7, 8, 9, 1, 11, 12} et à munir cet ensemble de l probbilité P S définie pr le tbleu 3.1, plus précisément : P S := k Ω P (S = k)δ k. (3.1) 2 36 1 36 Cette nouvelle probbilité s ppelle loi de l vrible létoire S. En d utre termes, nous vons rélisé vi S un trnsfert de l espce probbilisé ( Ω, P(Ω), P ) sur l espce probbilisé (Ω, P(Ω ), P S ). Si B P(Ω ), en notnt {S B} := {ω Ω; S(ω) B}, on insi puisque B est l union finie de ses singletons, P (S B) = k B P (S = k) = k Ω P (S = k)δ k (B) = P S (B). (3.2) Remrquons mintennt que l on peut fcilement grndir l ensemble d rrivée de S en remplçnt Ω pr Ω = R. On peut munir R u choix de l tribu P(R) ou Bor(R). En définissnt encore P S pr (3.1), le clcul (3.2) s dpte fcilement pour tout B P(R), donc fortiori pour tout B borélien : P (S B) = P (S B Ω ) = P (S = k) = P (S = k)δ k (B) = P S (B). (3.3) k B Ω k Ω Il y de bonnes risons à cet grndissement de l ensemble d rrivée, ne serit ce que pour pouvoir fire des opértions sur les vribles létoires. Imginons pr exemple que l on jette n fois l pire de dés et que l on s intéresse à l moyenne rithmétique M n des sommes obtenues. Il ne serit guère commode de trviller vec un espce d rrivée Ω n := M n (Ω n ), surtout si l on s intéresse u comportement de M n pour n tendnt vers l infini. Nous prendrons donc désormis comme ensemble d rrivée R pour les vribles létoires que nous étudierons. Si X(ω) est une grndeur physique (msse, tempérture, pression, longueur, etc.) mesurée à prtir du résultt ω d une expérience, il n est en générl ps possible de l déterminer vec une précision bsolue. Tout ce que l on peut dire est que X pprtient à un certin intervlle, dont l longueur dépend de l précision de l instrument de mesure utilisé. Les quntités pertinentes pour identifier l loi de X sont lors les P (X I) 92 Ch. Suquet, Cours I.P.É. 21
3.1. Introduction pour I intervlle 1 de R, plutôt que les P (X = x) qui pourrient être nulles pour tout x réel. Pour définir l loi de X, nous serons menés à poser P X (B) = P (X B) pour B borélien quelconque de R, sous réserve que cel it un sens. Voyons cel de plus près. Soit X une ppliction Ω R. Pour tout B R, notons {X B} := {ω Ω; X(ω) B} =: X 1 (B). Cette écriture «X 1» ne suppose ucunement l bijectivité de X. Il s git seulement d une nottion commode pour «l ensemble des ntécédents des éléments de B pr l ppliction X». On imerit pouvoir trnsporter pr X l probbilité P, mesure définie sur (Ω, F) en une probbilité P X, définie sur ( R, Bor(R) ) en posnt : B Bor(R), P X (B) := P ( X 1 (B) ) = P (X B). Pour que cette écriture it un sens, encore fut-il que X 1 (B) soit un élément de l tribu F sur lquelle est définie P. Nous supposerons donc que X vérifie l condition suivnte : B Bor(R), X 1 (B) F. (3.4) On dit lors que X est mesurble pour les tribus F et Bor(R). Nous réserverons le nom de vrible létoire ux pplictions X : Ω R vérifint (3.4). L mesurbilité est d illeurs une notion plus générle définie comme suit. Définition 3.1 (mesurbilité). Soit h : Ω 1 Ω 2, où Ω 1 et Ω 2 sont munis respectivement des tribus F 1 et F 2. On dit que h est mesurble 2 F 1 - F 2 si pour tout B F 2, h 1 (B) F 1. On démontre en théorie de l mesure le résultt suivnt. Proposition 3.2. Soient Ω 1 et Ω 2 deux ensembles munis respectivement des tribus F 1 et F 2 et C une fmille de prties de Ω 2 engendrnt F 2 (σ(c) = F 2 ). L ppliction h : Ω 1 Ω 2 est mesurble F 1 - F 2 si pour tout B C, h 1 (B) F 1. En prticulier en prennt Ω 2 = R, F 2 = Bor(R) et C l fmille des intervlles ], b], on voit que pour que X : Ω R soit une vrible létoire, il suffit que, b R, X 1 (], b]) F. L mesurbilité F - Bor(R) est conservée pr toutes les opértions usuelles de l lgèbre (somme, produit, combinisons linéires, composition,...) et de l nlyse 3, pourvu que les fmilles d pplictions concernées soient u plus dénombrbles (inf, sup, lim inf, lim sup, limite si elle existe d une suite de fonctions, série de fonctions,...). Bref, il s git d une notion très riche. Tellement riche en fit, que nous ne rencontrerons jmis dns ce cours d ppliction X : Ω R qui ne soit ps une vrible létoire. Ceci explique que dns les ouvrges de probbilités élémentires, on ppelle vrible létoire n importe quelle ppliction Ω R. 1. Ceci est en ccord vec l remrque fite p. 72 à propos de l crctéristion des probbilités sur ( R, Bor(R) ). 2. Ce lngge est trompeur : l mesurbilité ne fit intervenir ucune mesure, elle concerne seulement h et les tribus. 3. Pour les énoncés précis, voir le cours d IFP 23-24 chpitre 2 http://mth.univ-lille1.fr/~suquet/ens/ifp/cours/cours4/coursifp4.html Ch. Suquet, Cours I.P.É. 21 93
Chpitre 3. Vribles létoires 3.2 Générlités 3.2.1 Vribles létoires réelles Avnt de formliser l définition d une vrible létoire, commençons pr donner deux propriétés utiles des inverses ensemblistes. Proposition 3.3. Soit h : Ω 1 Ω 2 une ppliction. Pour tout B Ω 2, notons h 1 (B) := {ω Ω 1 ; h(ω) B}. L inverse ensembliste h 1 insi défini commute vec les unions et les intersections quelconques. Autrement dit, si (B i ) i I est une fmille quelconque de prties de Ω 2, ( ) h 1 B i = h 1 (B i ), (3.5) i I i I ( ) h 1 B i = h 1 (B i ). (3.6) i I i I L inverse ensembliste commute ussi vec le pssge u complémentire u sens suivnt : B Ω 2, h 1 (Ω 2 \ B) = Ω 1 \ h 1 (B). (3.7) Preuve. L églité d ensembles (3.5) se vérifie pr l chîne d équivlences logiques suivntes qui montre que l pprtennce u premier membre de (3.5) équivut à l pprtennce à son deuxième membre : ω h 1 ( i I B i ) h(ω) B i i I i I; h(ω) B i i I; ω h 1 (B i ) ω i I h 1 (B i ). On procède de même pour vérifier (3.6) : ( ) ω h 1 i i I h(ω) B i i I i I, h(ω) B i i I; ω h 1 (B i ) Voici l vérifiction de (3.7) : ω i I h 1 (B i ). h 1 (Ω 2 \ B) = {ω Ω 1 ; h(ω) (Ω 2 \ B)} = {ω Ω 1 ; h(ω) / B} = {ω Ω 1 ; ω / h 1 (B)} = Ω 1 \ h 1 (B). 94 Ch. Suquet, Cours I.P.É. 21
3.2. Générlités Définition 3.4 (vrible létoire réelle). Soit (Ω, F, P ) un espce probbilisé. On ppelle vrible létoire réelle sur (Ω, F), ou plus simplement vrible létoire, toute ppliction X : X : Ω R ω X(ω), mesurble F - Bor(R), i.e. vérifint : B Bor(R), X 1 (B) F. En rison de l proposition 3.2, il suffit que l condition ci-dessus soit vérifiée pour B =], b] vec et b réels quelconques, pour que X soit une vrible létoire. Remrque 3.5. Il importe de noter que l mesure de probbilité P sur (Ω, F) ne joue ucun rôle dns l définition de l notion de vrible létoire. C est pour cel que nous prlons de «vrible létoire sur (Ω, F)» plutôt que sur (Ω, F, P ). Définition 3.6 (vrible létoire discrète). On ppelle vrible létoire discrète sur (Ω, F), toute ppliction X : Ω R vérifint les deux conditions suivntes. (i) L ensemble des imges X(Ω) = {X(ω), ω Ω} est une prtie u plus dénombrble de R. On peut donc numéroter ses éléments pr des indices entiers 4 X(Ω) = {x, x 1,..., x k,...}. (ii) X est mesurble F - P(R), ce qui équivut ici à x X(Ω), X 1 ({x}) F. (3.8) Remrquons que si X est mesurble F - P(R), elle est fortiori mesurble F - Bor(R) puisque l condition X 1 (B) F doit être stisfite dns ce cs seulement pour les B pprtennt à l tribu Bor(R) qui est une sous-fmille de P(R). Pr conséquent, toute vrible létoire discrète est ussi une vrible létoire réelle. L équivlence pour X(Ω) u plus dénombrble, entre l mesurbilité F - P(R) et l condition (3.8) se justifie comme suit. D bord il est clir que l mesurbilité F - P(R) implique (3.8). Pour l réciproque, on suppose (3.8) vérifiée, on prend B P(R) quelconque et on montre qu lors X 1 (B) F. Notons B := B X(Ω) et B := B ( R \ X(Ω) ). Remrquons que B étnt inclus dns X(Ω) est u plus dénombrble et que X 1 (B ) =. Il suffit lors d écrire en utilisnt (3.5) X 1 (B) = X 1 (B B ) = X 1 (B ) X 1 (B ) = X 1 (B ) ( ) = X 1 x B {x} = X 1 ({x}), (3.9) x B pour fire pprître X 1 (B) comme union u plus dénombrble d éléments de l tribu F, ce qui implique son pprtennce à F. 4. Pour tous les exemples clssiques que nous rencontrerons, il est possible de les numéroter de mnière croissnte : x < x 1 < x 2.... Mis ce n est ps toujours le cs, cr l ensemble des vleurs possibles peut être pr exemple, les décimux (ou les rtionnels) de [, 1]. Ch. Suquet, Cours I.P.É. 21 95
Chpitre 3. Vribles létoires 3.2.2 Loi d une vrible létoire Une vrible létoire X permet de trnsporter l probbilité P définie sur (Ω, F) en une probbilité P X définie sur ( R, Bor(R) ). Proposition 3.7. Soit X une vrible létoire sur (Ω, F) et P une probbilité sur (Ω, F). L fonction d ensembles P X = P X 1 définie sur Bor(R) pr B Bor(R), P X (B) := P ( X 1 (B) ) = P (X B) (3.1) est une probbilité sur ( R, Bor(R) ). Preuve. D bord P X est bien définie comme ppliction Bor(R) [, 1] en rison de l mesurbilité F - Bor(R) de l vrible létoire X. Il est clir que P X (R) = P (Ω) = 1. Montrons l σ-dditivité de P X. Soit (B k ) k 1 une suite quelconque de boréliens de R deux à deux disjoints. Pr (3.6), les X 1 (B k ) sont des éléments deux à deux disjoints de l tribu d évènements F. En combinnt (3.5) vec l σ-dditivité de l probbilité P, on en déduit : ( ) ( P X B k = P (X 1 k 1 k 1 B k )) ( ) = P k 1 X 1 (B k ) = k 1 P ( X 1 (B k ) ) = k 1 P X (B k ). L fonction d ensembles P X est donc σ-dditive, c est une probbilité sur ( R, Bor(R) ). Définition 3.8 (loi d une vrible létoire). Soient (Ω, F, P ) un espce probbilisé et X une vrible létoire sur (Ω, F). On ppelle loi de X sous P, ou plus simplement loi de X, l probbilité P X sur ( R, Bor(R) ) définie pr (3.1). Si µ est une mesure de probbilité sur ( R, Bor(R) ), on dit que X «suit l loi µ» si P X = P X 1 = µ (i.e. l loi de X sous P est l mesure µ). Remrque 3.9. Dns les problèmes usuels de probbilités, on trville souvent vec un seul (Ω, F, P ) et on se contente lors de l ppeltion loi de X. Il n en v ps de même en sttistique où l on met générlement en concurrence plusieurs modèles (Ω, F, P θ ), où θ est un prmètre inconnu et où on se propose de choisir un de ces modèles u vu des vleurs X(ω) observées. C est là que l ppeltion loi de X sous P θ s impose. Pour donner un exemple simple, considérons le problème du sondge d un échntillon de 5 personnes vnt le second tour d une élection présidentielle opposnt le cndidt A u cndidt B. Ici θ est l proportion inconnue d électeurs votnt A dns l popultion totle. Si X est le nombre de personnes interrogées fvorbles à A, l loi de X sous P θ est l loi binomile 5 Bin(5, θ). 5. En fit c est une loi hypergéométrique (tirges sns remise), mis en rison du théorème 3.34, on peut l remplcer en prtique pr une binomile. 96 Ch. Suquet, Cours I.P.É. 21
3.2. Générlités Une utre sitution où il est nturel de considérer plusieurs lois pour une même vrible létoire est celle du conditionnement. Rppelons que si (Ω, F, P ) est un espce probbilisé et H F un évènement tel que P (H) >, on peut définir sur F une nouvelle mesure de probbilité P H = P (. H) pr A F, P H (A) := P (A H) = P (A H). P (H) Définition 3.1 (loi conditionnelle). Soient (Ω, F, P ) un espce probbilisé, H F tel que P (H) >, X une vrible létoire sur (Ω, F). On ppelle loi conditionnelle de X schnt H, l loi de X sous P H. En l notnt P X H, on donc B Bor(R), P X H (B) = P H ( X 1 (B) ) = P (X B H). Il importe de ne ps se lisser induire en erreur pr l nottion P X H, elle ne concerne ps une nouvelle vrible létoire «X H» mis bien toujours l même vrible létoire X. Ce qui chngé, c est l probbilité dont on munit (Ω, F) et sous lquelle on considère l loi de X. Dns le cs d une vrible létoire discrète X, il est fcile de donner une formule explicite pour l loi P X. Proposition 3.11. Soient (Ω, F, P ) un espce probbilisé et X une vrible létoire discrète sur (Ω, F). L loi de X sous P est l probbilité P X = P (X = x)δ x, (3.11) x X(Ω) que l on peut considérer comme probbilité sur ( X(Ω), P(X(Ω)) ), ou sur ( R, Bor(R) ) ou sur ( R, P(R) ). Preuve. Vérifions l églité de mesures (3.11) sur ( R, P(R) ) ( ) ( ), le résultt nlogue pour R, Bor(R) et X(Ω), P(X(Ω)) s en déduisnt imméditement pr restriction. D bord P X est ussi une probbilité sur ( R, P(R) ), pr une dpttion immédite 6 de l preuve de l proposition 3.7. En utilisnt l décomposition (3.9) on pour tout B R, ( P X (B) = P x B X(Ω) ) X 1 ({x}) = x B X(Ω) P ( X 1 ({x}) ) = L églité de mesures (3.11) sur ( R, P(R) ) est insi vérifiée. x X(Ω) P (X = x)δ x (B). Définition 3.12 (loi discrète sur R). On ppelle loi discrète sur R, toute mesure ponctuelle µ sur (R, P(R)) qui est ussi une probbilité. Une telle loi dmet donc une représenttion sous l forme µ = p i δ xi, i I où I est un ensemble d indices u plus dénombrble, (x i ) i I est une fmille de nombres réels et (p i ) i I est une fmille sommble de réels positifs, de somme i I p i = 1. 6. Rppelons qu une v.. discrète X sur (Ω, F) est mesurble F-P(R) et ps seulement F-Bor(R). Ch. Suquet, Cours I.P.É. 21 97
Chpitre 3. Vribles létoires Il est clir que pr restriction, µ est ussi une probbilité sur (R, Bor(R)). Remrque 3.13. Deux vribles létoires peuvent voir même loi sns être égles. Pr exemple considérons le jet de deux dés, l un bleu et l utre rouge. Notons X le nombre de points indiqué pr le dé bleu et Y celui du rouge. Les vribles létoires X et Y sont définies sur le même espce probbilisé Ω = {1, 2, 3, 4, 5, 6} 2 muni de l équiprobbilité. On X(Ω) = Y (Ω) = {1, 2, 3, 4, 5, 6} et : k {1, 2, 3, 4, 5, 6}, P (X = k) = 1 6, P (Y = k) = 1 6. Donc X et Y ont même loi : P X = P Y = 6 1 k=1 δ 6 k. Pour utnt, on n ps l églité des vribles létoires X et Y qui signifierit X(ω) = Y (ω) pour tout ω Ω (églité de deux pplictions). Autrement dit, en lnçnt deux dés on obtiendrit à coup sûr un double. Pr contre nous pouvons considérer l événement {X = Y } dont l rélistion n est ps certine et clculer s probbilité : ( 6 ) P (X = Y ) = P {(X, Y ) = (k, k)} = 6 k=1 36 = 1 6. On en déduit : P (X Y ) = 5/6. Remrque 3.14. Deux vribles létoires peuvent voir même loi en étnt définies sur des espces probbilisés différents (Ω, F, P ) et (Ω, F, P ). Prenons pr exemple pour X les points du dé bleu comme ci-dessus et posons Z = si X est pir, Z = 1 si X est impir. L vrible létoire Z est définie sur Ω = {1, 2, 3, 4, 5, 6} 2 muni de l tribu P(Ω) et de l équiprobbilité P sur Ω. S loi est P Z = 1 2 (δ + δ 1 ). Prenons mintennt Ω = { 1, 1}, muni de l tribu P(Ω ) et de l équiprobbilité P sur Ω et posons pour ω Ω, Z (ω ) := (1 + ω )/2. Alors l loi de Z est ussi P Z = 1 2 (δ + δ 1 ) = P Z. Remrquons que si X et Y sont définies sur des espces probbilisés différents, il n y ps d évènement {X = Y }, ps plus que de vrible létoire «X + Y». Essyez d en écrire l définition explicite pour vous en convincre. L remrque suivnte peut être sutée en première lecture. Remrque 3.15. Si X est une v.. discrète sur (Ω, F), lors pour toute probbilité P sur (Ω, F), l loi de X sous P est une loi discrète u sens de l définition 3.12. C est une conséquence de l proposition 3.11. Mis il peut ussi exister sur (Ω, F) une vrible létoire réelle Y et une probbilité P telles que Y ne soit ps discrète (i.e. Y (Ω) est un ensemble infini non dénombrble) mis que l loi de Y sous P soit une loi discrète. Voici un exemple simple. On prend Ω = R, F = P(R) et Y : ω ω l ppliction identité sur R. Alors Y n est ps une v.. discrète puisque Y (Ω) = R. Notons u pssge que Y est mesurble reltivement à n importe quelle tribu sur l ensemble d rrivée puisque l ensemble de déprt Ω est muni ici de l tribu P(Ω). En prticulier, Y est bien une vrible létoire réelle. Munissons mintennt (Ω, F) = (R, P(R)) de l mesure de probbilité P = 1 2 δ + 1 2 δ 1 et cherchons l loi de Y sous P. Comme Y est l identité sur R, on l églité Y 1 (B) = B pour tout borélien B. Pr conséquent 98 Ch. Suquet, Cours I.P.É. 21
3.2. Générlités P Y (B) = P (Y 1 (B)) = P (B) pour tout B Bor(R). On donc P Y = P = 1 2 δ + 1 2 δ 1, ce qui montre que l loi de Y sous P est l loi discrète 1 2 δ + 1 2 δ 1. Bien sûr on un résultt nlogue en remplçnt P pr n importe quelle loi discrète Q sur R, u sens de l définition 3.12. Remrque 3.16. Pour toute probbilité Q sur ( R, Bor(R) ), il existe u moins un espce probbilisé (Ω, F, P ) et une vrible létoire réelle X sur (Ω, F) dont l loi sous P soit égle à Q. Il suffit de prendre Ω = R, F = Bor(R) et pour X l ppliction identité de R R. En prennt P = Q, on clirement P X = Q. Bien entendu, il y une infinité d utres solutions à ce problème. Il y donc identité entre les mesures de probbilité sur ( R, Bor(R) ) et les lois des vribles létoires réelles. Comme nous svons crctériser une probbilité sur ( R, Bor(R) ) pr s fonction de réprtition (théorème 2.3), ceci v nous permettre de clssifier les lois des vribles létoires réelles. 3.2.3 Fonction de réprtition Définition 3.17 (f.d.r. d une vrible létoire). Soient (Ω, F, P ) un espce probbilisé et X une vrible létoire sur (Ω, F). On ppelle fonction de réprtition (f.d.r.) de X, l fonction F X définie sur R pr : x R, F X (x) = P X (], x]) = P (X x). L fonction F X est l fonction de réprtition de l probbilité P X, u sens de l définition 2.27. Elle ne dépend donc que de l loi 7 de X. Deux vribles létoires de même loi ont même fonction de réprtition. L proposition suivnte donnnt les propriétés générles des fonctions de réprtition des vribles létoires n est qu une simple réécriture de l proposition 2.28. Proposition 3.18. L fonction de réprtition F X d une vrible létoire X est croissnte sur R, vec limite en et 1 en +. Elle est continue à droite et limitée à guche en tout point de R et vérifie : x R, P (X = x) = F (x) F (x ). (3.12) L fonction de réprtition d une vrible létoire crctérise s loi, utrement dit : F X = F Y si et seulement si les vribles létoires X et Y ont même loi. On peut ussi trduire l remrque 2.29 pour obtenir les formules suivntes de clcul 7. Il serit plus correct, mis plus long, de prler de f.d.r. de l loi de X ou même de f.d.r. de l loi de X sous P. Ch. Suquet, Cours I.P.É. 21 99
Chpitre 3. Vribles létoires à l ide de F X des P (X I) pour I intervlle de R : P ( < X b) = F X (b) F X (), (3.13) P ( X b) = F X (b) F X ( ), (3.14) P ( X < b) = F X (b ) F X ( ), (3.15) P ( < X < b) = F X (b ) F X (), (3.16) P (X ) = F X (), (3.17) P (X < ) = F X ( ), (3.18) P (X > b) = 1 F X (b), (3.19) P (X b) = 1 F X (b ). (3.2) Dns le cs prticulier des vribles létoires discrètes, on peut donner une formule explicite de clcul de l fonction de réprtition. Proposition 3.19 (f.d.r. d une vrible létoire discrète). Soient (Ω, F, P ) un espce probbilisé et X une vrible létoire discrète sur (Ω, F). Fixons une numérottion de l ensemble u plus dénombrble X(Ω) pr les entiers : X(Ω) = {x, x 1,..., x k,...} et notons p k := P (X = x k ). L fonction de réprtition F X vérifie lors : x R, F X (x) = p k 1 [xk,+ [(x), (3.21) ce qui s écrit ussi x k X(Ω) x R, F X (x) = x k X(Ω) x k x P (X = x k ). (3.22) De plus, si on peut numéroter les éléments de X(Ω) de mnière croissnte (i.e. k, x k < x k+1 ), l fonction F X est constnte sur chque intervlle [x n, x n+1 [ et vut sur cet intervlle F X (x) = k n p k. Cette proposition se générlise u cs des vribles létoires de loi discrète 8, en remplçnt X(Ω) pr X P (Ω) = {x R; P (X = x) > }. Preuve. En utilisnt (3.11), on obtient en effet pour tout x R, F X (x) = P X (], x]) = p k δ xk (], x]) = p k 1 [xk,+ [(x), (3.23) en notnt que δ xk (], x]) = x k X(Ω) x k X(Ω) { { 1 si x k ], x] si x k / ], x] = 1 si x k x si x k > x = 1 [x k,+ [(x). Si l suite (x k ) est strictement croissnte, le réel x pprtient à un seul intervlle [x n, x n+1 [. Pour k n, on lors x k x n x et 1 [xk,+ [(x) = 1, tndis que si k > n, x k x n+1 > x, donc 1 [xk,+ [(x) =. On donc F X (x) = k n p k et ceci étnt vlble pour tout x [x n, x n+1 [, l fonction F X est constnte sur cet intervlle. 8. Voir l remrque 3.15. 1 Ch. Suquet, Cours I.P.É. 21
3.2. Générlités À titre d exemple, l figure 3.2 donne l représenttion grphique de F S où S est l vrible létoire somme des points de deux dés. y 1 2 3 4 5 6 7 8 9 1 11 12 Fig. 3.2 f.d.r. de S somme des points de deux dés x Si l on veut esquisser une clssifiction sommire des lois des vribles létoires, on peut commencer pr les prtger entre les lois à f.d.r. continue sur R et les lois à f.d.r. non continue 9 sur R. On prle plus simplement de lois continues ou encore lois diffuses dns le premier cs et de lois non continues ou non diffuses dns le deuxième. Dns l fmille des lois non continues, nous connissons déjà l sous-fmille des lois discrètes. Dns l fmille des lois continues, une importnte sous-fmille est celle des lois à densité que nous llons exminer mintennt. 3.2.4 Lois à densité L loi d une vrible létoire X est à densité f si pour tout intervlle de R, l probbilité d pprtennce de X à cet intervlle peut s écrire comme l intégrle de f sur cet intervlle. L pprente simplicité de cette définition informelle est trompeuse. Dns le cdre de ce cours, nous ne pouvons utiliser que l intégrtion u sens de Riemnn et il se trouve que cette notion n est ps totlement stisfisnte pour les besoins de l théorie des probbilités. L intégrle de Lebesgue donnerit une notion plus générle de densité, 9. Rppelons que l ensemble des points de discontinuité d une f.d.r. quelconque est u plus dénombrble. Ch. Suquet, Cours I.P.É. 21 11
Chpitre 3. Vribles létoires permettnt entre utres de crctériser les lois à densité comme celles dont l f.d.r. est bsolument continue 1. L définition plus restrictive que nous donnons ci-dessous est nénmoins suffisnte pour l pluprt des cs prtiques. Définition 3.2 (densité de probbilité). On ppelle densité de probbilité sur R toute fonction f vérifint ) f est définie et positive sur R \ K, où K est une prtie finie (éventuellement vide) de R ; b) f est Riemnn intégrble sur tout intervlle [, b] R \ K ; c) l intégrle générlisée de f sur ], + [ converge et + f(t) dt = 1. Si f est une fonction positive définie seulement sur un intervlle ], b[ de R et telle que b f(t) dt = 1, on peut en fire une densité en l prolongent à tout R en posnt f(t) := pour t / ], b[. Voici qutre exemples simples de densités : f 1 (t) := 1 b 1 [,b](t); f 2 (t) := 1 2 t 1 ],1](t); f 3 (t) := e t 1 [,+ [ (t); f 4 (t) := 1 π(1 + t 2 ). Remrque 3.21 (usge des indictrices dns les formules explicites). L définition de f 2 repose sur un bus d écriture d usge cournt. En effet il y en toute rigueur un problème pour clculer f 2 (t) lorsque t, puisqu lors il nous fut former le produit de l expression 1 2 non définie (du moins en tnt que nombre réel) pr. L convention t doptée est que si l formule de clcul d une fonction contient le produit d une indictrice pr une expression non définie lorsque cette indictrice est nulle, le produit vut dns ce cs. Ceci permet de considérer que l «définition» de f 2 comme ci-dessus est un rccourci d écriture commode pour : f 2 (t) := { 1 2 t si t ], 1], si t / ], 1]. Définition 3.22. Soient (Ω, F, P ) un espce probbilisé et X une vrible létoire réelle sur (Ω, F). L loi de X sous P pour densité f si : R, b, P (X ], b]) = b f(t) dt. (3.24) On dit ussi pr bus de lngge que X pour densité f (lorsqu il n y ps mbiguïté sur P ). 12 Ch. Suquet, Cours I.P.É. 21
3.2. Générlités y y = f(t) P ( < X b) b t Fig. 3.3 P ( < X b) = b f(t) dt pour X de densité f Remrque 3.23. Il est clir d près cette définition que si Y est une utre vrible létoire ynt même loi que X ( donc mêmes probbilités d pprtennce ux intervlles), elle ussi l densité f. D utre prt, il n y ps unicité de l densité d une vrible létoire. Pr exemple g 1 = 1 [,1] et g 2 = 1 ],1[ sont deux densités de probbilité qui donnent les mêmes intégrles : b g 1(t) dt = b g 2(t) dt pour toute pire de réels et b. Ces deux fonctions peuvent chcune être prise comme densité de l loi uniforme sur [, 1] (nous y reviendrons ci-dessous). L exemple ci-dessus montre qu il ne suffit ps de vérifier que deux vribles létoires ont des densités qui diffèrent en un point pour en déduire qu elles n ont ps même loi. Le lemme suivnt donne une condition suffisnte prtique pour que deux vribles à densité n ient ps même loi. Lemme 3.24. Soient X et Y deux vribles létoires dmettnt respectivement pour densité les fonctions f et g. On suppose qu il existe un réel t tel que f(t ) g(t ) et que de plus, f et g sont toutes deux continues u point t. Alors X et Y n ont ps même loi. Preuve. On peut supposer sns perte de générlité que f(t ) < g(t ). On v exploiter l continuité de f et g u point t pour construire un intervlle [, b] voisinge de t tel que b f(t) dt < b g(t) dt. Comme ces deux intégrles sont égles respectivement à P (X ], b]) et P (Y ], b]), ceci impliquer que X et Y n ont ps même loi. Fixons ε > tel que f(t ) + ε < g(t ) ε, pr exemple ε = (g(t ) f(t ))/3. Pr continuité de f et g u point t, il existe deux réels δ 1 > et δ 2 > tels que : t ]t δ 1, t + δ 1 [, f(t) < f(t ) + ε et t ]t δ 2, t + δ 2 [, g(t) > g(t ) ε. L intersection des deux intervlles ouverts ]t δ 1, t + δ 1 [ et ]t δ 2, t + δ 2 [ contient un intervlle [, b] vec < b, on peut prendre pr exemple = t 1 2 min(δ 1, δ 2 ) et 1. L fonction F : R R est dite bsolument continue sur R, si pour tout ε >, il existe δ > tel que pour toute fmille finie d intervlles [ k, b k ] (k = 1,..., n) deux à deux disjoints et vérifint n k=1 (b k k ) δ, on it n k=1 F (b k) F ( k ) ε. Cette propriété est plus forte que l continuité uniforme sur R. Pr illeurs toute f.d.r. continue sur R est uniformément continue sur R (exercice). Ch. Suquet, Cours I.P.É. 21 13
Chpitre 3. Vribles létoires b = t + 1 2 min(δ 1, δ 2 ). On dispose lors des inéglités suivntes : t [, b], qui pr intégrtion sur [, b] nous donnent b f(t) < f(t ) + ε < g(t ) ε < g(t), f(t) dt (b )(f(t ) + ε) < (b )(g(t ) ε) d où b f(t) dt b g(t) dt, ce qui chève l preuve 11. b g(t) dt, Exminons mintennt les reltions entre densité (lorsqu elle existe) et fonction de réprtition (qui elle, existe toujours) d une vrible létoire. Proposition 3.25. Si l vrible létoire X pour densité f, s fonction de réprtition F vérifie : ) x R, F (x) = x f(t) dt ; b) F est continue sur R ; c) si f est continue u point x, lors F est dérivble en ce point et F (x ) = f(x ). Corollire 3.26. Si l vrible létoire X pour densité f, on pour, b R quelconques, P ( < X < b) = P ( < X b) = P ( X < b) = P ( X b) = P (X < ) = P (x ) = P (X > b) = P (X b) = Preuve de l prop. 3.25 et du corollire 3.26. + b f(t) dt, f(t) dt. Preuve de ). Puisque X pour densité f, on pour tous réels < b, P (X ], b]) = F (b) F () = b b f(t) dt, f(t) dt. (3.25) Il suffit d ppliquer (3.25) vec b = x fixé et = n pour chque n N tel que n < x. L suite d événements A n := {X ] n, x]}, n > x, est croissnte pour l inclusion et pour réunion A = {X ], x]}. Pr continuité monotone séquentielle (cf. proposition 2.16), on P (A n ) P (A), d où F (x) = P (A) = lim P (X ] n, x]) = lim n + n + x n f(t) dt = en notnt que l intégrle générlisée de l densité f converge en. x f(t) dt, 11. Prmi les inéglités de l ligne précédente, seule l deuxième est stricte et ce n est ps une erreur typogrphique. Voyez-vous pourquoi? 14 Ch. Suquet, Cours I.P.É. 21
3.2. Générlités Preuve de b). Fixons x R quelconque. On sit déjà que F est continue à droite en tout point comme toute fonction de réprtition. Il suffit donc de montrer l continuité à guche en x. D près le point b) de l définition 3.2, il existe < x tel que f soit définie et Riemnn intégrble sur tout intervlle [, ] [, x [. On lors x lim x x f(t) dt = x f(t) dt, où l deuxième intégrle est soit une intégrle de Riemnn ordinire soit une intégrle générlisée convergente. Cette reltion peut ussi s écrire à l ide de F : ( ) lim F (x) F () = F (x ) F (). x x On en déduit pr ddition de F () que F (x) tend vers F (x ) qund x tend vers x pr vleurs inférieures. Preuve de c). Puisque f est continue en x, elle est définie sur tout un voisinge de x et donc sur tout un intervlle ], b[ contennt x. L continuité de f en x peut lors s écrire : ε >, ]x δ, x + δ[ ], b[; t ]x δ, x + δ[, f(t) f(x ) < ε. (3.26) Pour tout h tel que < h < δ, on lors F (x + h) F (x ) = x +h x f(t) dt d où x +h( ) F (x + h) F (x ) hf(x ) = f(t) f(x ) dt hε. En divisnt pr h on voit que F bien une dérivée en x et que celle ci vut f(x ). L proposition 3.25 est mintennt complètement démontrée. Pour le corollire 3.26, il suffit de combiner les reltions générles (3.13) (3.2) vec (3.24) et les points ) et b) de l proposition 3.25. Remrques 3.27. 1. Pour toute densité f (u sens de l définition 3.2), il existe une vrible létoire X ynt f pour densité : il suffit d ppliquer le théorème 2.3 pour obtenir l existence d une mesure de probbilité µ sur ( R, Bor(R) ) ynt pour f.d.r F définie pr ). L remrque 3.16 nous ssure de l existence d une vrible létoire X de loi µ, donc de f.d.r. F. L preuve du b) ci-dessus nous montre que F est continue sur R. En prticulier pour toute pire de réels b, on P ( < X b) = F (b) F () = b f(t) dt f(t) dt = b f(t) dt. 2. D près b) toute vrible létoire à densité une fonction de réprtition continue. L réciproque est fusse : il existe des lois à fonction de réprtition continue sns densité. x Ch. Suquet, Cours I.P.É. 21 15
Chpitre 3. Vribles létoires 3. Pr illeurs si X une densité, s fonction de réprtition n est ps forcément dérivble en tout point. Pr exemple l densité f 2 ci-dessus pour fonction de réprtition ssociée F 2 (x) = x1 ],1] (x) + 1 ]1,+ [ (x) (cette écriture condensée signifie que F 2 (x) est nul sur R, vut x entre et 1 et reste constnt égl à 1 sur ]1, + [). F 2 est dérivble en tout point suf en et en 1. L proposition suivnte donne une règle prtique permettnt de trouver l densité (lorsqu elle existe!) à prtir de l fonction de réprtition dns les cs les plus cournts. Proposition 3.28. On suppose que l fonction de réprtition F de X est C 1 pr morceux u sens suivnt : F est continue sur R et dérivble sur R privé (éventuellement) d un ensemble fini de points 1 <... < n. Sur chcun des intervlles ouverts ], 1 [, ] i, i+1 [ (1 i < n), ] n, + [, l dérivée f de F est continue. Alors X pour densité f. Preuve. Il est commode de poser := et n+1 = +. Sur chcun des intervlles ouverts I découpés pr les i, F est dérivble et s dérivée f est continue. On sit lors que f une infinité de primitives sur I et que si l on fixe un α dns I, toute primitive H de f sur I est de l forme H(x) = x f(t) dt + C, vec C constnte. Comme F est l une α des primitives de f sur I, en prennt H = F et en fisnt x = α, on voit que l constnte C vut F (α). On donc pour α et x quelconques dns I, F (x) F (α) = x f(t) dt. α Fixons α et prenons x α. Fisons tendre x vers l borne supérieure i de I. Comme F est continue (ou dns le cs i = +, F une limite 1), l intégrle générlisée i f(t) dt α converge et vut F ( i ) F (α) (ou 1 F (α) qund i = + ). De même en fisnt tendre α vers i 1 on voit que l intégrle générlisée i i 1 f(t) dt converge et vut F ( i ) F ( i 1 ) (ou F ( i ) qund i 1 = ). Finlement soient et b > quelconques dns R. Si et b sont dns le même intervlle I on directement F (b) F () = b f(t) dt. Sinon on note ( i ) i i i 1 l ensemble de tous les i qui sont dns [, b] et on écrit F (b) F () = F ( i ) F () + i 1 1 i=i ( F (i+1 ) F ( i ) ) + F (b) F ( i1 ) = b f(t) dt, en utilisnt l reltion de Chsles pour les intégrles générlisées. On donc toujours P (X ], b]) = F (b) F () = b f(t) dt, ce qui montre que X pour densité f. 3.3 Lois discrètes clssiques Dns toute l suite du chpitre, on fixe un espce probbilisé (Ω, F, P ), on désigne pr X une vrible létoire sur (Ω, F) et pr P X s loi sous P. Cette cluse ser implicite chque fois que nous écrirons dns les définitions «L vrible létoire X suit l loi...si...». Pour X de loi discrète, nous utiliserons l nottion : X P (Ω) := {x R; P (X = x) > }. (3.27) 16 Ch. Suquet, Cours I.P.É. 21
3.3. Lois discrètes clssiques Bien sûr, X P (Ω) est toujours inclus dns l ensemble des vleurs «possibles» X(Ω) et dns l pluprt des situtions prtiques d utilistion des vribles létoires, ces deux ensembles sont égux 12. 3.3.1 Lois de Bernoulli Définition 3.29. L vrible létoire X suit l loi de Bernoulli de prmètre p (p [, 1]) si X P (Ω) = {, 1} vec : On noter X Bern(p). P (X = 1) = p, P (X = ) = 1 p = q. Si A est un événement de probbilité p, son indictrice définie pr { { 1 si ω A 1 si A est rélisé 1 A (ω) = si ω / A = si A n est ps rélisé est une vrible létoire suivnt l loi de Bernoulli de prmètre p. Réciproquement, si X est une v.. de Bernoulli, on peut toujours écrire que X = 1 A presque-sûrement, c est-à-dire P (X = 1 A ) = 1, en définissnt A = {ω Ω, X(ω) = 1}. 3.3.2 Loi uniforme sur un ensemble fini de réels Définition 3.3. L vrible létoire X suit l loi uniforme sur l ensemble de réels {x 1,..., x n } si P X est l équiprobbilité sur cet ensemble. Nottion : X Unif{x 1,..., x n }. D où Autrement dit, l ensemble des vleurs possibles de X est X(Ω) = {x 1,..., x n } et : k = 1,..., n, P (X = x k ) = 1 n. P X = 1 n n δ xk. Pr exemple le nombre de points indiqué pr un dé suit l loi uniforme sur {1, 2, 3, 4, 5, 6}. 3.3.3 Lois binomiles Définition 3.31. L vrible létoire X suit l loi binomile de prmètres n et p (n N et p [, 1]) si X P (Ω) = {, 1,..., n} et Nottion : X Bin(n, p). k=1 k =, 1,..., n, P (X = k) = C k np k (1 p) n k. 12. Pour comprendre l utilité de ce distinguo entre X(ω) et X P (Ω), (re)lisez l remrque 3.15. Ch. Suquet, Cours I.P.É. 21 17
Chpitre 3. Vribles létoires L formule ci-dessus définit bien une loi de probbilité puisque les C k np k (1 p) n k sont positifs et : n Cnp k k (1 p) n k = ( p + (1 p) ) n = 1 n = 1, k= en ppliqunt l formule du binôme de Newton (d où le nom de l loi). L loi binomile Bin(n, p) est l loi du nombre de succès obtenus en une suite de n épreuves répétées indépendntes vec pour chque épreuve une probbilité de succès p. Ceci été démontré dns l exemple 2.57. De même, soit A 1,..., A n une fmille de n événements mutuellement indépendnts ynt tous même probbilité p et notons X i l vrible de Bernoulli indictrice de A i : { 1 si ω Ai, X i (ω) = si ω A c i. Alors l vrible létoire S n = n X i suit l loi binomile Bin(n, p). i=1 3.3.4 Lois hypergéométriques Alors que l loi binomile intervient dns les tirges vec remise, l loi hypergéométrique correspond ux tirges sns remise. Exemple 3.32. Dns une production totle de N objets dont M sont défectueux, on prélève u hsrd un échntillon de n objets (tirge sns remise). Soit X le nombre létoire d objets défectueux dns l échntillon. Quelle est s loi? On peut prendre comme espce Ω l ensemble de tous les échntillons possibles (toutes les prties à n éléments d un ensemble de crdinl N) muni de l équiprobbilité. Chque échntillon insi une probbilité 1/CN n d être choisi. Les échntillons (événements élémentires) rélisnt l événement {X = k} sont ceux qui contiennent k objets défectueux et n k objets défectueux. Ceci n est rélisble que si k M et n k N M. Dénombrons ces échntillons. On les forme en choisissnt k objets défectueux dns une sous-popultion de M et en complétnt pr n k objets non défectueux choisis dns une sous popultion de N M. Il y en donc CM k Cn k N M. Finlement : P (X = k) = Ck M Cn k N M C n N si { k M, n k N M. (3.28) Définition 3.33. L loi définie pr (3.28) s ppelle loi hypergéométrique de prmètres N, M et n. Nottion : X Hypg(N, M, n). Le prmètre N est l effectif de l popultion totle, M celui de l sous-popultion à lquelle on s intéresse et n l tille de l échntillon observé. 18 Ch. Suquet, Cours I.P.É. 21
3.3. Lois discrètes clssiques Pour une tille d échntillon n fixée, plus N et M sont grnds, moins les tirges sns remise diffèrent des tirges vec remise. Plus précisément, l loi hypergéométrique converge vers l loi binomile u sens suivnt. Théorème 3.34 (convergence de l hypergéométrique vers l binomile). On suppose que qund N tend vers +, M = M(N) tend vers + en vérifint l condition : M lim N + N = p vec < p < 1. (3.29) Alors, n restnt fixé, l loi hypergéométrique Hypg(N, M, n) converge vers l loi binomile Bin(n, p), ce qui signifie que si (X N ) N 1 est une suite de v.. vec X N Hypg(N, M, n) et Y est une v.. de loi binomile Bin(n, p),lors : utrement dit : k =, 1,..., n, lim P (X N = k) = P (Y = k), (3.3) N + k =, 1,..., n, CM k lim Cn k N M N + CN n = C k np k (1 p) n k. (3.31) Preuve. Remrquons d bord que comme p est strictement positif, l hypothèse (3.29) implique que M tend vers + vec N ; il en v de même pour N M puisque p < 1. Pour n et k fixés, posons : p N = Ck M Cn k N M = C n N M! k!(m k)! (N M)! (n k)! ( (N M) (n k) ) n!(n n)!! N! = C k n M! (M k)! (N M)! ( ) (N M) (n k)! (N n)!. (3.32) N! Comme k est fixé et M tend vers +, l première frction dns (3.32) est le produit de k fcteurs M, (M 1),..., (M k + 1) tous équivlents 13 à M d où : M! (M k)! M k, N +. (3.33) Pr le même rgument vec n k et N M u lieu de k et M : (N M)! ( (N M) (n k) )! (N M) n k, N +. (3.34) Enfin : (N n)! N! 1, N +. (3.35) N n 13. Rppelons que deux suites (u N ) et (v N ) sont dites équivlentes lorsque u N = v N (1 + ε N ) vec ε N tendnt vers qund N tend vers + (nottion : u N v N ). Ch. Suquet, Cours I.P.É. 21 19
Chpitre 3. Vribles létoires En reportnt ces équivlents dns (3.32), on voit que lorsque N tend vers + : d où : p N Cn k M k (N M) n k M = C k N n( n N lim p N = Cnp k k (1 p) n k. N + 3.3.5 Lois géométriques ) k ( N M ) n k, (3.36) Exemple 3.35 (un problème de temps d ttente). Considérons une suite infinie d épreuves répétées indépendntes vec même probbilité de succès p ], 1[. Soit X le numéro (létoire) de l première épreuve où l on obtient un succès. Si l on n obtient jmis de succès, on conviendr que X = +. Clculer P (X = k) pour tout k N. En déduire les vleurs de P (X N ) et P (X = + ). En notnt R i = {succès à l i-ème épreuve}, on : {X = k} = {échec ux (k 1) premières et succès à l k-ième} ( k 1 ) = i=1 Rc i R k. D où pr indépendnce des épreuves : P (X = k) = ( k 1 i=1 N ) P (Ri) c P (R k ) = (1 p) k 1 p. Posons q = 1 p et notons que q ], 1[. L décomposition de l événement {X N } en l réunion disjointe des {X = k} (k N ) nous donne pr σ-dditivité : P (X N ) = k N P (X = k) = k N q k 1 p = p l N = p 1 1 q = 1. q l (l = k 1) Ainsi vec probbilité 1, le premier succès pprît u bout d un nombre fini d épreuves 14. Remrquons qu on urit pu rriver u même résultt en montrnt que P (X = + ) = pr l méthode utilisée à l exemple 2.57 c) en échngent les rôles de succès et échec. En toute rigueur, X n est ps une vrible létoire discrète u sens de l définition 3.6 puisque X(Ω) est est une prtie dénombrble de R u lieu de R. Nénmoins X := X1 {X<+ } est une vrible létoire discrète et ce qui précède montre que X même loi 15 que X. Cette loi est celle du temps d ttente du premier succès dns une suite d épreuves répétées indépendntes, on l ppelle loi géométrique de prmètre p. 14. Mis ps borné pr un nombre fixé choisi vnt le début des épreuves... 15. Pour être tout à fit rigoureux, il fudrit voir défini les v.. à vleurs dns R et leurs lois, ce qui nous urit fit sortir du cdre de ce cours... 11 Ch. Suquet, Cours I.P.É. 21
3.3. Lois discrètes clssiques Définition 3.36. Une vrible létoire X suit l loi géométrique de prmètre p ], 1[, si X P (Ω) = N et : k N, P (X = k) = (1 p) k 1 p. Nottion : X Geom(p). Lorsque X suit une loi géométrique, les probbilités P (X > n) ont une expression prticulièrement simple en fonction de q = 1 p. Clculons les de deux fçons. Première méthode. On clcule le reste d une série géométrique : P (X > n) = + k=n+1 q k 1 p = + l=n q l p + + = pq n q l n = pq n l=n = pqn 1 q = qn. Deuxième méthode. On se plce dns l sitution de l exemple 3.35. L événement {X > n} se rélise si et seulement si les n premières épreuves donnent un échec. {X > n} = n i=1 R c i. En utilisnt l indépendnce des R i on en déduit : n P (X > n) = P (Ri) c = q n. 3.3.6 Lois de Poisson i=1 Définition 3.37. On dit que l vrible létoire discrète X suit l loi de Poisson de prmètre α > si X P (Ω) = N et Nottion : X Pois(α). k N, P (X = k) = e α α k. k! On sit (cf. cours d nlyse) que l fonction exponentielle un développement en série entière vec ryon de convergence infini. En prticulier : On donc bien : + k= α >, e α = P (X = k) = e α + k= + k= α k k!. j= q j α k k! = e α e α = 1. Une des risons de l importnce de cette loi est le théorème de convergence de l loi binomile vers l loi de Poisson. Ch. Suquet, Cours I.P.É. 21 111
Chpitre 3. Vribles létoires Théorème 3.38. Si (p n ) n 1 est une suite de réels de [, 1] vérifint lors : k N, np n α ], + [, qund n +, (3.37) Cnp k k n(1 p n ) n k e α α k, qund n +. k! Preuve. L hypothèse (3.37) peut s écrire sous l forme plus mnible : np n = αu n vec u n tendnt vers 1 qund n tend vers +. Ainsi p n = αu n /n et C k np k n(1 p n ) n k = n! 1 α (n k)! k!( n ) ku ( k n 1 αu n n ) n k. (3.38) Pour obtenir l limite de cette expression lorsque n tend vers +, k restnt fixé, on remrque successivement que : Pour justifier (3.41), on écrit : ( 1 αu n n lim n + lim n + n! 1 = 1, (3.39) (n k)! nk lim n + uk n = 1, (3.4) ( 1 αu ) n k n = e α. n (3.41) ) n k [ ( = exp (n k) ln 1 αu n n )], (3.42) puis comme αu n /n tend vers : ( (n k) ln 1 αu ) n n ( n αu n n ) α, (n + ). Pr continuité de l fonction exponentielle, l limite du second membre de (3.42) est donc bien e α, ce qui prouve (3.41). On obtient lors l conclusion du théorème en pssnt à l limite dns (3.38). Le théorème 3.38 sert de justifiction théorique à l règle prtique suivnte : lorsque n est «grnd» et np «petit», on peut remplcer l loi binomile Bin(n, p) pr l loi de Poisson Pois(α) où α = np. En générl on considère que n de l ordre de quelques centines et np de l ordre de quelques unités donnent une bonne pproximtion. Sous cette forme, cette règle relève plus de l cuisine que des mthémtiques. Il est possible pr des techniques élémentires de contrôler l erreur commise en utilisnt cette pproximtion. Nous nous contenterons ici d un exemple clssique et d une comprison grphique pour illustrer l qulité de cette pproximtion. 112 Ch. Suquet, Cours I.P.É. 21
3.3. Lois discrètes clssiques Exemple 3.39. Le président d un bureu de vote est né un 1 er vril. Il décide de noter le nombre X de personnes ynt leur nniversire le même jour que lui prmi les 5 premiers électeurs qui se présentent. L sitution peut être ssimilée à une suite d épreuves répétées indépendntes et X est une vrible létoire binomile de prmètres n = 5 et p = 1/365 (en négligent l question des nnées bissextiles sinon on prendrit p = 4/(3 365 + 366), ce qui ne chngerit ps grnd chose numériquement). Ainsi : ( 1 ) k ( 364 ) 5 k. P (X = k) = C5 k 365 365 L règle énoncée ci-dessus nous conduit à pproximer l loi de X pr une loi de Poisson de prmètre : α = np = 5 1 365. Voici une comprison numérique pour les petites vleurs de k : k 1 2 3 4 5 P (X = k),253 7,348 4,238 8,18 9,37 2,1 1 e α α k k!,254 1,348 1,238 5,18 9,37 3,1 2 Remrquons que l probbilité d observer plus de 5 nniversires un 1 er vril, clculée pr l loi excte de X ou pr son pproximtion poissonienne est inférieure à,3. Comprison grphique : Les digrmmes en bâtons ci-dessous représentent l loi binomile Bin(n, p) et l loi de Poisson pproximnte Pois(α) vec α = np. Les segments verticux (les bâtons) du digrmme représentnt l loi d une vrible discrète X ( à vleurs dns N) ont une huteur égle à P (X = k) vec une extrémité inférieure u point d bscisse k de l xe horizontl. Pour l lisibilité, on légèrement déclé vers l guche les bâtons de l loi de Poisson (en bleu) et vers l droite ceux de l loi binomile(en rouge). Bien que le digrmme en bâtons de l loi binomile Bin(n, p) soit constitué théoriquement de n + 1 bâtons (et que celui de l loi de Poisson en it une infinité), seul un petit nombre de bâtons est visible sur les grphiques, les utres correspondnt à des probbilités trop petites 16. L échelle verticle de chque figure été choisie de fçon dpttive de fçon que l vnt dernière grdution verticle donne l vleur de l plus grnde probbilité binomile. On constte que pour n = 2 (figure 3.7), l différence entre les deux digrmmes n est prtiquement plus discernble visuellement. 16. En fit, on s est contenté d fficher les probbilités correspondnt à k inférieur ou égl à l prtie entière supérieure de 2α + 4. On peut vérifier que l somme des probbilités insi négligées est inférieure à 1%, pour chcune des deux lois. Ch. Suquet, Cours I.P.É. 21 113
Chpitre 3. Vribles létoires.2663.213.1598.165.533. -1 1 2 3 4 5 6 7 8 9 1 11 12 13 Fig. 3.4 Lois Bin(25;,16) et Pois(4).255.24.153.12.51. -1 1 2 3 4 5 6 7 8 9 1 11 12 13 Fig. 3.5 Lois Bin(5;,8) et Pois(4) 114 Ch. Suquet, Cours I.P.É. 21
3.3. Lois discrètes clssiques.249.199.15.1.5. -1 1 2 3 4 5 6 7 8 9 1 11 12 13 Fig. 3.6 Lois Bin(1;,4) et Pois(4) Ch. Suquet, Cours I.P.É. 21 115
Chpitre 3. Vribles létoires.247.197.148.99.49. -1 1 2 3 4 5 6 7 8 9 1 11 12 13 Fig. 3.7 Lois Bin(2;,2) et Pois(4) 3.3.7 Sur le crctère universel de l loi de Poisson L étude qui suit pour but de mieux fire sisir l importnce de l loi de Poisson, en justifint u pssge le bien fondé de l hypothèse (3.37) du théorème de convergence de l loi binomile vers l loi de Poisson. Considérons un phénomène se trduisnt pr des observtions (ou rélistions) létoires pendnt un intervlle de temps [, 1[ (exemples : désintégrtions d tomes, ccidents d vion, fux numéros de téléphone sur un stndrd, éruptions volcniques, nissnces de triplés,...). On suppose que le phénomène vérifie les hypothèses suivntes : () Les observtions dns des intervlles de temps disjoints sont indépendntes. (b) Pour tout réel t tel que t < t + T 1 l loi du nombre (létoire) d observtions dns l intervlle [t, t + T [ ne dépend que de l durée T de cet intervlle. Prtgeons l intervlle de temps [, 1[ en n intervlles disjoints I n,k = [ k n, k + 1 [, k < n. n Notons : p n = P ( voir exctement une observtion dns I n,k ) r n = P ( voir u moins une observtion dns I n,k ). 116 Ch. Suquet, Cours I.P.É. 21
3.3. Lois discrètes clssiques D près (b), p n et r n ne dépendent ps de k. En écrivnt de deux fçons l probbilité de n voir ucune observtion dns [, 1[ on obtient : ( n 1 { [ k 1 r 1 = P ucune observtion dns k= n, k + 1 [ }) n = (1 r n ) n en utilisnt () et (b). D où 1 r n = (1 r 1 ) 1/n. Un développement limité à l ordre 1 de cette expression nous permet d écrire : 1 ) (1 r 1 ) 1/n = exp( n ln(1 r 1) = 1 + 1 n ln(1 r 1) + δ n n, Nous noterons désormis : où lim δ n =. n + ln(1 r 1 ) = α, α ], + [. (3.43) Il vient r n = α δn d où lim n n n + nr n = α. Pour le type de phénomène que nous envisgeons, il est vrisemblble que l on rrive à isoler les observtions lorsque les intervlles de l subdivision sont ssez petits : symptotiquement, l probbilité d voir plus d une observtion dns [k/n, (k + 1)/n[ est négligeble devnt celle d en voir exctement une. Plus précisément, nous rjoutons à notre modèle l hypothèse : (c) ε n = r n p n, qund n +. p n D près (c), r n /p n converge vers 1, d où lim n + np n = α. Cherchons mintennt l probbilité d voir exctement l observtions dns [, 1[. Cette probbilité peut se décomposer en : où P (l observtions dns [, 1[) = P (A n ) + P (B n ), (3.44) A n = { l observtions vec u plus une dns chque I n,k }, B n = { l observtions vec u moins un I n,k en contennt plusieurs }. Clcul de P (A n ) : Notons D i = E i = { [ i exctement une observtion dns n, i + 1 n { [ i ucune observtion dns n, i + 1 n [ }, [ }, i < n. L événement A n est l réunion disjointe de tous les événements du type : ( ) ( ) D i E j, i I j J Ch. Suquet, Cours I.P.É. 21 117
Chpitre 3. Vribles létoires où I {1,..., n}, crd I = l et J = {1,..., n} \ I. D près l hypothèse d indépendnce (), l probbilité de chcun de ces événements est p l n(1 r n ) n l d où : P (A n ) = C l np l n(1 r n ) n l. Pour trouver l limite de P (A n ) lorsque n tend vers l infini, l restnt fixé, il suffit d dpter l preuve du théorème 3.38 : ici nous vons à trouver l limite de (1 r n ) n l u lieu de (1 p n ) n l. Or (n l) ln(1 r n ) nr n α, d où lim n + (1 r n ) n l = e α. On en déduit : lim P (A n) = e α α l. (3.45) n + l! Mjortion de P (B n ) : Le clcul de P (B n ) étnt trop compliqué, nous nous contenterons d une mjortion. L rélistion de l événement B n implique l existence d u moins deux observtions dns u moins l un des intervlles de longueur 1/n. Autrement dit : n 1 { [ k B n u moins deux observtions dns n, k + 1 [ }. n k= Pr conséquent P (B n ) ( n 1 { [ k P u moins deux observtions dns k= n, k + 1 [ } ) n n 1 (r n p n ) = n(r n p n ) = np n ε n. k= D près (c) et l convergence de np n vers α, np n ε n tend vers qund n tend vers +. Il en est donc de même pour P (B n ). Pour conclure, on remrque que (3.44) est vérifiée pour tout entier n 1 et que le premier membre de cette églité ne dépend ps de n. Cette églité reste donc vrie à l limite : P (l observtions dns [, 1[) = lim n + ( P (An ) + P (B n ) ) = e α α l, l! d près (3.45) et l mjortion de P (B n ). Ce résultt étnt vlble pour tout entier l, nous vons donc démontré : Théorème 3.4. Soit un phénomène donnnt lieu à des observtions létoires vérifint les hypothèses : () Les observtions dns des intervlles de temps disjoints sont indépendntes (b) Pour tout réel t tel que t < t + T 1 l loi du nombre (létoire) d observtions dns l intervlle [t, t + T [ ne dépend que de l durée T de cet intervlle. 118 Ch. Suquet, Cours I.P.É. 21
3.4. Lois à densité clssiques (c) En notnt p n l probbilité d voir exctement une observtion dns un intervlle de temps de durée 1/n et r n celle d en voir u moins une, ε n = r n p n p n, qund n +. Alors le nombre létoire d observtions dns l intervlle [, 1[ suit l loi de Poisson de prmètre α défini pr α = ln(1 r 1 ). Remrque 3.41. L exmen ttentif de l démonstrtion ci-dessus montre que l structure d ordre de l intervlle [, 1[ n y joue ucun rôle. L importnt est l possibilité de réliser une prtition de [, 1[ en intervlles de même longueur tendnt vers. Pr conséquent en remplçnt l longueur pr l ire ou le volume, il est possible d obtenir une version sptile en dimension 2 ou 3 du théorème 3.4. Ceci permet de comprendre pourquoi l loi de Poisson fournit une bonne modélistion pr exemple du nombre d erreurs typogrphiques dns une pge imprimée, du nombre d impcts de météorites sur un territoire donné, du nombre d ccidents sur une portion d utoroute pendnt une période donnée, du nombre de risins dns une portion de cke, du nombre d étoiles dns une région de l univers,... 3.4 Lois à densité clssiques 3.4.1 Lois uniformes Définition 3.42. L vrible létoire réelle X suit l loi uniforme sur l intervlle [, b] ( < < b < + ) si B Bor(R), P (X B) = P X (B) = λ 1([, b] B), (3.46) λ 1 ([, b]) où λ 1 désigne l mesure de Lebesgue sur R (en prticulier λ 1 ([, b]) = b ). Nottion : X Unif[, b]. Clculons l fonction de réprtition F en prennt B =], x] pour x quelconque dns (3.46). F (x) = P X (], x]) = λ 1([, b] ], x]) λ 1 ([, b]) si < x < ; x = si x < b; b 1 si b x < +. L fonction de réprtition F est ffine pr morceux, donc ussi C 1 pr morceux u sens de l proposition 3.28, vec dérivbilité sur R \ {, b} (figure 3.8). L loi donc une densité f qui s obtient pr dérivtion de F, ce qui nous donne f(t) = si t <, f(t) = 1 si < t < b et f(t) = si t > b. On complète l définition de f en l b Ch. Suquet, Cours I.P.É. 21 119
Chpitre 3. Vribles létoires f(t) b t F (x) 1 b x Fig. 3.8 f.d.r. F et densité f de l loi Unif[, b] prolongent en et b, pr exemple en posnt f() = f(b) = 1. L loi uniforme sur b [, b] dmet donc pour densité f = 1 b 1 [,b]. Dns les clculs fisnt intervenir l loi uniforme sur [, b], il est vivement conseillé d utiliser chque fois que c est possible l formule (3.46) de préférence ux clculs d intégrles de f. Remrque 3.43. Comme λ 1 ({}) = λ 1 ({b}) =, l loi uniforme sur [, b] est ussi l loi uniforme sur ], b], [, b[ ou ], b[. Une des risons de l importnce de l loi uniforme sur [, 1] est le théorème suivnt. Théorème 3.44. Si X est une vrible létoire réelle de fonction de réprtition continue strictement croissnte F et si U est une vrible létoire de loi uniforme sur [, 1], lors l vrible létoire Y := F 1 (U) même loi que X. Rppelons qu voir même loi que X ne signifie ucunement être égle à X. Ce théorème permet de réduire l simultion informtique de l loi de X à celle de U. Nous verrons ultérieurement que ce résultt s étend à toutes les fonctions de réprtition, sns hypothèse de continuité ni de croissnce stricte (vec une définition dptée de F 1 ). Preuve. Comme F est continue strictement croissnte, c est une bijection de R sur son imge ], 1[ (en rison de l stricte monotonie de F, les bornes et 1 ne sont ps 12 Ch. Suquet, Cours I.P.É. 21
3.4. Lois à densité clssiques tteintes). Pr conséquent F 1 :], 1[ R est bien définie et vérifie : u ], 1[, x R, F 1 (u) x si et seulement si u F (x). Comme P ( < U < 1) = 1, on en déduit que les évènements {F 1 (U) x} et {U F (x)} ont même probbilité. Pour obtenir l fonction de réprtition de Y, on remrque lors que pour tout x R, P (Y x) = P (F 1 (U) x) = P (U F (x)) = λ 1([, F (x)]) λ 1 ([, 1]) = F (x). Ainsi Y pour fonction de réprtition F donc même loi que X. 3.4.2 Lois exponentielles Définition 3.45. Soit un réel strictement positif. L vrible létoire réelle X suit l loi exponentielle de prmètre si elle dmet pour densité f(t) = e t 1 [,+ [ (t). f(t) 1 2 t F (x) 1 1 2 x Fig. 3.9 Densité et f.d.r. de l loi Exp() Ch. Suquet, Cours I.P.É. 21 121
Chpitre 3. Vribles létoires En prtique, plutôt que de trviller vec l fonction de réprtition d une loi exponentielle, il est plus commode d utiliser l fonction de survie G : { 1 si x, G(x) = P (X > x) = 1 F (x) = e x si x >. Les lois exponentielles sont souvent choisies pour modéliser des temps d ttente : temps d ttente à prtir de mintennt du prochin tremblement de terre, du prochin fux numéro sur une ligne téléphonique, de l prochine désintégrtion d un tome de rdium, etc. L rison de ce choix est l propriété d bsence de mémoire en temps continu qui crctérise l fmille des lois exponentielles. Théorème 3.46 (bsence de mémoire). i) Si l vrible létoire X suit une loi exponentielle, lors elle vérifie l propriété d bsence de mémoire : s R +, t R +, P (X > t + s X > t) = P (X > s). (3.47) ii) Réciproquement si une vrible létoire X vérifie (3.47), lors elle suit une loi exponentielle. Comme l fonction de survie crctérise l loi, (3.47) signifie que l loi de (X t) conditionnelle à {X > t} est l même que l loi de X. En préliminire à l preuve du théorème, remrquons que l probbilité conditionnelle dns (3.47) s exprime commodément à l ide de l fonction de survie G de l vrible létoire X, définie pr G(x) := P (X > x). En effet, s étnt positif, on t + s t d où l inclusion de {X > t + s} dns {X > t} et l églité d évènements : {X > t + s} {X > t} = {X > t + s}. On en déduit P (X > t + s X > t) = P (X > t + s) P (X > t) = G(t + s). (3.48) G(t) Preuve de i). Si X suit l loi exponentielle de prmètre, on G(x) = e x pour tout x positif et (3.48) se trduit lors pr : P (X > t + s X > t) = e (t+s) e t = e s = P (X > s). Ainsi X de loi Exp() vérifie l propriété d bsence de mémoire (3.47). Preuve de ii). Soit X une vrible létoire dont l loi vérifie (3.47) et G s fonction de survie. Comme G = 1 F (où F désigne l fonction de réprtition de X), G est décroissnte et continue à droite et tend vers en +. De plus l écriture de (3.47) suppose implicitement que G(t) > pour tout t cr sinon P (. X > t) ne serit 122 Ch. Suquet, Cours I.P.É. 21
3.4. Lois à densité clssiques ps définie. Grâce à (3.48), on voit que l propriété d bsence de mémoire (3.47) équivut à s R +, t R + G(t + s), = G(s). G(t) L fonction de survie G doit donc être une solution décroissnte, continue à droite, tendnt vers en + et telle que < G(t) 1 de l éqution fonctionnelle 17 : s R +, t R +, G(t + s) = G(t)G(s). (3.49) En fisnt s = t = dns (3.49), on obtient G() = G() 2 et comme G() >, on G() = 1. (3.5) En fisnt s = t dns (3.49), on obtient G(2t) = G(t) 2, puis de proche en proche n N, t, G(nt) = G(t) n. (3.51) En prticulier pour t = 1/d, d N : n N, d N, ( n ) ( 1 ) n. G = G (3.52) d d Lorsque n = d, (3.52) donne G(1) = G(1/d) d d où ( 1 d N, G = G(1) d) 1/d. (3.53) Nous connissons mintennt G sur l ensemble des rtionnels positifs puisque (3.5), (3.51), (3.52) et (3.53) nous donnent r Q +, G(r) = G(1) r. (3.54) Soit x R + \ Q +, x est limite d une suite décroissnte (r n ) de rtionnels. Comme G est continue à droite, G(r n ) converge vers G(x). D utre prt l ppliction y G(1) y est continue sur R. Ainsi en ppliqunt (3.54) à r n et en fisnt tendre n vers l infini on obtient x R +, G(x) = G(1) x. (3.55) A priori l constnte G(1) est dns ], 1]. On peut écrter l vleur G(1) = 1 cr sinon d près (3.55), l limite en + de G serit 1 lors qu elle vut. Finlement, puisque < G(1) < 1, on peut poser G(1) = e pour un réel > (cel revient à prendre = ln G(1)). On peut lors réécrire (3.55) sous l forme x R +, G(x) = e x. L fonction de survie G est donc l même que celle de l loi exponentielle de prmètre, donc X suit cette loi (puisque l fonction de survie crctérise l loi u même titre que l fonction de réprtition). 17. Une éqution fonctionnelle est une éqution dont l inconnue est...une fonction! Les équtions différentielles sont des exemples bien connus d équtions fonctionnelles. Ch. Suquet, Cours I.P.É. 21 123
Chpitre 3. Vribles létoires 3.4.3 Lois gussiennes Ces lois jouent un rôle cpitl dns l étude des lois limites de sommes de vribles létoires indépendntes. Pr exemple (théorème de de Moivre Lplce) si S n suit l loi Bin(n, p), lors pour tout x R, P ( S n np x np(1 p) ) converge qund n tend vers l infini vers Φ(x), où Φ est l f.d.r. de l loi gussienne N(, 1). Définition 3.47. On dit que l vrible létoire X suit l loi gussienne ou normle N(m, σ) si elle pour densité l fonction : f m,σ : R R + t 1 ) ( σ 2π exp (t m)2. 2σ 2 L loi N(, 1) est ppelée loi normle stndrd. Tous les clculs de probbilités concernnt une vrible létoire de loi N(m, σ) peuvent se rmener à des clculs sur une vrible de loi normle stndrd. Proposition 3.48. Si l vrible létoire X suit l loi N(m, σ), lors Y := (X m)/σ suit l loi N(, 1). Autrement dit, toute v.. gussienne X de loi N(m, σ) peut s écrire X = σy + m vec Y de loi N(, 1). Preuve. On clcule P ( < Y b) pour et b réels quelconques ( < b). ( P < X m ) b = P (σ + m < X σb + m) σ σb+m ) 1 = ( σ 2π exp (x m)2 dx. 2σ 2 σ+m Il suffit lors de fire le chngement de vrible y = (x m)/σ pour obtenir b ) 1 R, b >, P ( < Y b) = exp ( y2 dy. 2π 2 Donc Y bien l densité f,1. Remrque 3.49. En dptnt le clcul fit dns l preuve de l proposition 3.48, on voit fcilement que l fmille des lois gussiennes est stble pr trnsformtions ffines : si X pour loi N(m, σ), lors pour tout (α, β) R R, l v.. αx + β est encore gussienne, de loi N(αm + β, α σ). L figure 3.1 illustre l significtion du prmètre de position m et du prmètre de dispersion σ pour l loi gussienne N(m, σ). Cette concentrtion de prtiquement toute l probbilité dns l intervlle [m 3σ, m + 3σ] permet l utilistion des lois gussiennes pour modéliser des grndeurs létoires qui priori prennent leurs vleurs seulement dns un petit intervlle de R + : tille, poids,..., même si théoriquement une vrible gussienne peut prendre toute vleur entre et +. Il n existe ps d expression d une primitive de l densité gussienne f m,σ à l ide des fonctions usuelles. Les vleurs de l fonction de réprtition Φ de N(, 1) sont tbulées, cf. pge 269. D près l proposition 3.48, ceci suffit pour clculer numériquement n importe quelle f.d.r. de loi gussienne. 124 Ch. Suquet, Cours I.P.É. 21
3.4. Lois à densité clssiques m 3σ m 2σ m σ m m + σ m + 2σ m + 3σ 68, 3% 95, 4% 99, 7% Fig. 3.1 Concentrtion de l loi N(m, σ) utour de m 3.4.4 Lois de Cuchy Définition 3.5. L vrible létoire X suit l loi de Cuchy (ou loi de Cuchy de prmètres et 1) si elle dmet pour densité : Nottion : X Cu(, 1). f(t) = 1 π(1 + t 2 ). Cette loi est symétrique, ce qui signifie que X et X ont même loi, ceci résultnt ici de l prité de f. L fonction de réprtition F est donnée pr : F (x) = x dt π(1 + t 2 ) = 1 ( π ) π 2 + rctn x, où rctn x est l unique réel y ] π/2, π/2[ tel que tn y = x. Ch. Suquet, Cours I.P.É. 21 125
Chpitre 3. Vribles létoires Si Y = + bx, vec X de loi Cu(, 1), R et b R +, on dit encore que Y suit une loi de Cuchy, de prmètres (, b), nottion Y Cu(, b). L densité est lors f,b (t) = 1 πb 1 1 + ( t b ) 2. 126 Ch. Suquet, Cours I.P.É. 21
Chpitre 4 Espérnce 4.1 Introduction L espérnce d une vrible létoire est, lorsqu elle existe, l moyenne des vleurs de cette vrible, pondérées pr leurs probbilités de rélistion. On voit bien comment trduire cette définition informelle dns le cs d une vrible létoire discrète X en posnt : EX := xp (X = x). (4.1) x X(Ω) Cette formule n de sens que si l fmille de réels {xp (X = x); x X(Ω)} est sommble, ce qui se trduit pr l condition suivnte pour l existence de l espérnce de l v.. discrète X : x P (X = x) < +. (4.2) x X(Ω) Tnt que l on reste dns le cdre des vribles létoires discrètes, cette définition est stisfisnte et permet d étblir toutes les propriétés de l espérnce (cf. cours de Deug Introduction u Clcul des Probbilités, Chp. 5). En bonne plce prmi ces propriétés figure l dditivité de l espérnce, i.e. si X et Y définies sur le même (Ω, F, P ) ont une espérnce, il en v de même pour X + Y et on E(X + Y ) = EX + EY. (4.3) Essyons de trduire l définition informelle ci-dessus dns le cs d une vrible létoire à densité f. On prt de (4.1) et on remplce P (X = x) pr P (X [x, x+ dx]), probbilité «vlnt 1 f(x) dx» et on remplce l somme (ou série) pr une intégrle, ce qui conduit à : EX := + xf(x) dx, (4.4) 1. Nous ne prétendons ps donner un sens rigoureux à cette probbilité d pprtennce à un «intervlle infinitésiml», il s git juste d une pproche intuitive. 127
Chpitre 4. Espérnce l condition d existence de l espérnce étnt tout simplement l convergence bsolue de cette intégrle générlisée, ce qui vu l positivité de f, se trduit pr : + x f(x) dx < +. (4.5) Cette définition mlgré son nlogie formelle vec (4.1) est loin d offrir l même souplesse pour étblir les propriétés de l espérnce. Pr exemple l preuve de l dditivité est complètement hors de portée. En effet, si X et Y sont à densité, X + Y n est ps forcément à densité 2 et lors le premier membre de (4.3) n est même ps défini pour l v.. Z = X + Y. L solution donnée à ce problème pr l théorie moderne des probbilités est l définition dns le cs générl, de l espérnce de X comme une intégrle bstrite sur Ω, reltivement à l mesure P : EX := X(ω) dp (ω), si X(ω) dp (ω) < +. (4.6) Ω On peut donner une première idée de ce qu est cette intégrle bstrite en considérnt le cs d une vrible létoire X telle que X(Ω) = {x 1,..., x n }. Alors en notnt A k := {X = x k } = {ω Ω; X(ω) = x k }, on : n X(ω) dp (ω) = x k P (A k ), (4.7) Ω ce qui trduit bien l définition informelle de EX comme l moyenne des vleurs de X pondérées pr leurs probbilités de rélistion. Le pssge u cs d une vrible létoire X quelconque revient précisément à construire une intégrle u sens de Lebesgue sur (Ω, F, P ) et cette théorie sort du cdre de notre progrmme. Il nous fut donc trouver une utre définition de EX. Cette définition doit permettre un tritement unifié de toutes les lois 3. Rppelons qu il existe des lois qui ne sont ni discrètes ni à densité et que l description l plus générle des lois de vribles létoires réelles est donnée pr leur fonction de réprtition, cf. le théorème 2.3 et l remrque 3.16. Il est donc nturel de chercher à définir EX à prtir de l fonction de réprtition F : t P (X t). Nous llons motiver cette définition en nous restreignnt u cs des vribles létoires positives et en prtnt du cs simple où X est discrète vec X(Ω) = {x 1,..., x n } prtie finie de R +. Dns ce cs, l définition informelle de EX se trduit pr l formule EX = n k=1 x kp (X = x k ). Les figures 4.1 et 4.2 nous montrent comment exprimer cette moyenne pondérée à l ide de F. Rppelons que dns ce cs, F présente en chque x k un sut d mplitude P (X = x k ). L interpréttion grphique en terme d ires donnée pr l figure 4.2 nous permet d écrire EX comme l intégrle de Riemnn ordinire : EX = x n (1 F (t)) dt et ussi comme l fusse intégrle générlisée + (1 F (t)) dt. 2. Alors que l somme de deux vribles létoires discrètes est toujours une vrible létoire discrète. 3. L définition informelle de EX nous fit pressentir que EX ne doit dépendre que de l loi de X, ce qui est bien le cs dns les formules (4.1) et (4.4). Ω k=1 128 Ch. Suquet, Cours I.P.É. 21
4.1. Introduction y 1 x k P (X = x k ) x 1 x k x n t Fig. 4.1 Interpréttion grphique des x k P (X = x k ), pour x k y 1 EX x 1 x n t Fig. 4.2 Interpréttion grphique de EX = n k=1 x kp (X = x k ), les x k. Ch. Suquet, Cours I.P.É. 21 129
Chpitre 4. Espérnce Si on psse mintennt u cs d une vrible létoire positive quelconque, il prît lors nturel de considérer que EX est l ire (éventuellement infinie) délimitée pr le segment verticl t =, y [, 1], l demi droite «symptote» y = 1, t et le grphe de F, ce qui nous conduit à l formule EX := + (1 F (t)) dt = y 1 + P (X > t) dt, pour toute v.. positive X. EX y = F (t) t Fig. 4.3 Interpréttion grphique de EX vi l f.d.r. de X v.. positive. Nous verrons que cette définition permet d étblir en toute générlité les propriétés de l espérnce. Bien sûr nous devrons retrouver à prtir de cette définition, les formules (4.1) et (4.4) pour X discrète ou à densité. 4.2 Espérnce d une vrible létoire positive Dns toute l suite de ce chpitre, on fixe un espce probbilisé (Ω, F, P ). Toutes les vribles létoires considérées seront, suf mention explicite du contrire, définies sur cet espce et leur loi ser l loi sous P. Définition 4.1 (espérnce d une v.. positive). Soit X une vrible létoire positive 4 sur (Ω, F). On ppelle espérnce de X (ou espérnce de X sous P ) l quntité qui est un élément de R +. EX := + 4. C est-à-dire une ppliction Ω R +, mesurble F - Bor(R + ). P (X > t) dt, (4.8) 13 Ch. Suquet, Cours I.P.É. 21
4.2. Espérnce d une vrible létoire positive Pour justifier l existence de EX, on commence pr noter que l ppliction G : R + [, 1], t G(t) := P (X > t) est décroissnte sur R +, donc Riemnn intégrble sur [, b] pour tout b R +, cf. proposition A.9. L intégrle b G(t) dt = b P (X > t) dt existe donc bien et est un réel positif pour tout b. Comme c est une fonction croissnte de s borne supérieure b, elle converge dns R + qund b tend vers +. Dns cette section, nous utiliserons l interpréttion grphique de EX vi l fonction de survie t P (X > t) (cf. figure 4.4) plutôt que vi l f.d.r. F : t P (X t). On psse évidemment d une représenttion à l utre en effectunt une symétrie orthogonle pr rpport à l droite y = 1/2, puisque G = 1 F. Cette symétrie conserve les ires, cf. prop. 2.14. y 1 y = P (X > t) EX t Fig. 4.4 Interpréttion grphique de EX vi l fonction de survie de X v.. positive. Remrque 4.2. EX ne dépend que de l loi de X, il serit donc plus correct de prler de l espérnce de l loi de X sous P u lieu de l espérnce de X. L usge donne nénmoins l préférence à cette dernière ppelltion qund il n y ps d mbiguïté sur P. Remrque 4.3 (espérnce d une v.. presque sûrement positive). Dns les exercices, l vrible létoire X n est ps toujours donnée explicitement, il rrive ssez souvent que l on ne connisse que s loi P X. Si P X (R + ) = 1, on s utoriser une générlistion de l définition 4.1 en considérnt que l formule (4.8) reste vlble. Il s git bien d une générlistion cr on peut voir P (X ) = 1 sns que X(ω) soit positif ou nul pour tout ω, pr exemple si Ω = R, F = Bor(R), P est l loi uniforme sur [, 1] et X : ω ω est l identité sur R. On lors X(ω) < pour une infinité non dénombrble de ω s et P (X ) = 1. Cette générlistion est cohérente vec l remrque 4.2 cr si X est une vrible létoire réelle définie sur un espce probbilisé (Ω, F, P ) et telle que Ch. Suquet, Cours I.P.É. 21 131
Chpitre 4. Espérnce P (X ) = 1, on peut toujours trouver un espce probbilisé (Ω, F, P ) et une vrible létoire positive X définie sur cet espce tels que X et X ient même loi. Il suffit de prendre Ω = R +, F = Bor(R + ), P = P X et X : R + R, ω ω égle à l identité sur R +. On lors pour tout borélien B de R, P X (B) = P (X B) = P ({ω Ω ; X (ω) B} = P (B R + ) = P X (B R + ) = P X (B) cr P X (B R ) P X (R ) =. Ceci montre que X et X ont même loi 5. Définition 4.4 (intégrbilité d une v.. positive). On dit que l vrible létoire positive X est intégrble si + P (X > t) dt < +. (4.9) Exemple 4.5. Si l vrible létoire positive X est bornée, i. e. s il existe une constnte c telle que pour tout ω Ω, X(ω) c, lors elle est intégrble. En effet pour t c, P (X > t) =, ce qui réduit l intégrle générlisée définissnt EX à une intégrle de Riemnn ordinire c P (X > t) dt donc finie (et mjorée pr c). Plus générlement, si l loi de X, v.. positive, vérifie P (X > t) Ct α pour un certin α > 1 et tout t t >, ou si P (X > t) t 1 (ln t) β pour un β > 1 et tout t t >, lors X est intégrble. Réciproquement, l intégrbilité de X nous donne un renseignement sur l vitesse de convergence 6 vers de P (X > t) qund t tend vers +. C est l inéglité de Mrkov que nous verrons ci-dessous (proposition 4.16). Voyons mintennt quelques exemples simples de clcul d espérnce de vribles létoires positives. Exemple 4.6 (espérnce d une constnte positive). Si l vrible létoire X est une constnte positive c, i.e. X(ω) = c pour tout ω Ω, lors EX = c. En effet on clirement : { 1 si t < c P (X > t) = si t c = 1 ],c[(t), d où EX = + 1 ],c[ (t) dt = c 1 [,c[ (t) dt = c 1 dt = c. L exemple suivnt est d une grnde importnce cr il permet d écrire toute probbilité d évènement comme une espérnce. Nous le formulons sous forme de proposition. Proposition 4.7 (espérnce d une indictrice d évènement). Pour tout évènement A F, E ( 1 A ) = P (A). (4.1) 5. L tribu borélienne de R + est l plus petite tribu contennt tous les ouverts de R +. On peut vérifier qu un sous-ensemble B de R + est un borélien de R + si et seulement s il s écrit B R + où B est un borélien de R. 6. Pour n importe quelle vrible létoire X, P (X > t) tend vers qund t tend vers +, cr G(t) = 1 F (t), où F est l f.d.r. de X qui tend toujours vers 1 en +. 132 Ch. Suquet, Cours I.P.É. 21
4.2. Espérnce d une vrible létoire positive y 1 Fig. 4.5 Espérnce de l v.. constnte X = c c t y 1 P (A) 1 t Fig. 4.6 Espérnce de l v.. indictrice X = 1 A Preuve. L vrible létoire positive 1 A prend l vleur 1 sur l évènement A et sur A c, elle suit l loi de Bernoulli de prmètre P (A). L évènement {1 A > t} est donc égl à A si t < 1 et à l ensemble vide si t 1. On en déduit que : P (1 A > t) = { P (A) si t < 1, si t 1. Pr conséquent, E ( ) 1 1 A = P (A) dt = P (A). Dns ce chpitre, les vribles létoires discrètes X ne prennt qu un nombre fini de vleurs jouent un rôle importnt cr elles vont nous permettre d étblir pr pssge à l limite les principles propriétés de l espérnce. Il est commode de les dénommer comme suit. Définition 4.8 (vrible létoire simple). On dit que l vrible létoire réelle X définie sur (Ω, F) est simple ou étgée si X(Ω) est fini. En notnt X(Ω) = {x 1,..., x n }, Ch. Suquet, Cours I.P.É. 21 133
Chpitre 4. Espérnce X dmet l décomposition n X = x k 1 Ak, où A k := {X = x k }, k = 1,..., n, (4.11) k=1 les évènements A k formnt une prtition de Ω. Proposition 4.9 (espérnce d une v.. positive simple). Si X est une vrible létoire positive simple vec X(Ω) = {x 1,..., x n }, EX = n x k P (X = x k ). (4.12) k=1 On retrouve insi l formule (4.1) de l introduction dns le cs prticulier où X(Ω) est fini ; voir ussi (4.7). Preuve. Notons en préliminire qu il nous fut résister ici à l tenttion de dire «c est immédit en utilisnt l décomposition (4.11), l proposition 4.7 et l linérité de l espérnce», cr nous n vons ps encore prouvé que l espérnce est linéire. En fit l proposition 4.9 est l un des ingrédients de l preuve de l linérité de l espérnce. Il nous fut donc vérifier (4.12) pr un clcul direct bsé sur l définition 4.1. Quitte à réindexer, on peut toujours supposer que les x k sont rngés pr ordre croissnt. Notons p i := P (X = x i ) et s k := 1 i k p i. L fonction de réprtition F peut lors s écrire n 1 F (t) = s k 1 [xk,x k+1 [(t) + s n 1 [xn,+ [(t). k=1 Notons que pour t x n, F (t) = s n = 1, donc P (x > t) = 1 F (t) =. Ainsi + P (X > t) dt = x n P (X > t) dt. On peut lors clculer EX comme suit en utilisnt les propriétés de l intégrle de Riemnn sur l intervlle fermé borné [, x n ]. EX = xn (1 F (t)) dt = x n xn n 1 F (t) dt = x n k=1 n 1 xk+1 x k s k dt = x n (x k+1 x k )s k = x n k=1 n n 1 x j s j 1 + x j s j j=2 j=1 n 1 = x n x n s n 1 + x j (s j s j 1 ) + x 1 s 1 j=2 n 1 = x n p n + x j p j + x 1 p 1 = j=2 n p k x k. j=1 134 Ch. Suquet, Cours I.P.É. 21
4.2. Espérnce d une vrible létoire positive Proposition 4.1 (espérnce d une v.. positive à densité). Si l vrible létoire positive X pour densité f, on EX = + xf(x) dx. (4.13) Dns cette formule, EX peut prendre l vleur + si l intégrle générlisée diverge. Preuve. Si X dmet pour densité f, on pour tout t, P (X > t) = + f(x) dx. En t reportnt cette églité dns l définition de EX, on obtient : + + { + } + { + } P (X > t) dt = f(x) dx dt = f(x)1 [t,+ [ (x) dx dt. t Notons que pour t, on 1 [t,+ [ (x) = 1 [,x] (t). L intégrnde (x, t) 1 [,x] (t)f(x) étnt positive, le théorème de Fubini-Tonelli légitime l interversion des intégrtions 7, ce qui donne : EX = + { + } f(x)1 [,x] (t) dt dx = + { + } f(x) 1 [,x] (t) dt dx. Comme pour x, + 1 [,x] (t) dt = x dt = x, on en déduit (4.13). Remrque 4.11. Notons que dns l démonstrtion ci-dessus, nous n vons utilisé à ucun moment l positivité de l vrible létoire X. On peut donc ppliquer ce clcul à toute vrible létoire réelle X ynt une densité f pour obtenir : + P (X > t) dt = + xf(x) dx (églité dns R + ). (4.14) Attention à ne ps écrire EX u premier membre de (4.14), cette quntité n étnt pour l instnt définie que pour X positive. L vrie formule pour EX lorsque l v.. réelle X est à densité est donnée à l proposition 4.32. Proposition 4.12. Si X est une vrible létoire positive et c une constnte réelle strictement positive, on E(cX) = cex. Cette églité reste vrie pour c = si X est de plus intégrble. Preuve. Puisque X est une vrible létoire positive et c une constnte positive, cx : ω (cx)(ω) := cx(ω) est une vrible létoire positive. En lui ppliqunt l définition 4.1, on obtient : E(cX) = + 7. Même si les intégrles vlent +. P (cx > t) dt = + ( P X > t ) dt. c Ch. Suquet, Cours I.P.É. 21 135
Chpitre 4. Espérnce Dns cette intégrle générlisée d une fonction positive loclement intégrble sur [, + [, on peut effectuer le chngement de vrible s = t/c, cf. proposition B.41-ii), qui nous donne : + ( E(cX) = P X > t ) + dt = c P (X > s) ds = cex. c Dns le cs prticulier c =, cette méthode n est plus vlble (on ne peut déjà plus écrire «P (cx > t) = P (X > t/c)») mis l formule est vrie trivilement à condition que EX soit finie, puisqu lors E( X) = E() = et EX =. Proposition 4.13 (croissnce de l espérnce). Si X et Y sont deux vribles létoires positives définies sur le même (Ω, F, P ) et si X Y i.e. X(ω) Y (ω) pour tout ω Ω, lors EX EY. Preuve. Si X(ω) > t, lors comme Y (ω) X(ω), on ussi Y (ω) > t. Ceci justifie l inclusion d évènements {X > t} {Y > t}, puis l inéglité P (X > t) P (Y > t). Cette dernière inéglité étnt vérifiée pour tout t, on peut l intégrer entre et +, pour obtenir 8 : EX = + P (X > t) dt + P (Y > t) dt = EY. Proposition 4.14. Pour toute vrible létoire positive X, on l églité (dns R + ) : + P (X > t) dt = + P (X t) dt. (4.15) Avnt d en donner l preuve, notons que (4.15) n rien d évident cr P (X > t) et P (X t) peuvent différer pour certines vleurs de t (u plus pour une infinité dénombrble de vleurs de t). Preuve. Notons respectivement I et J le premier et le deuxième membre de (4.15). On prouve leur églité en montrnt l inéglité dns les deux sens. L inéglité I J s obtient pr intégrtion de l inéglité P (X > t) P (X t) vrie pour tout t. Pour montrer que J I, fixons ε > quelconque. L intégrnde dns J est une fonction positive loclement Riemnn intégrble sur [, + [. On peut donc effectuer dns J le chngement de vrible «trnsltion» t = s + ε, cf. proposition B.41-i), qui nous donne : J = + ε P (X s + ε) ds = ε P (X s + ε) ds + + P (X s + ε) ds. 8. L croissnce de l intégrle de Riemnn (cf. prop. A.21 ii)) psse ux intégrles générlisées de fonctions positives. En effet, si f et g sont positives et loclement Riemnn intégrbles sur [, + [ et telles que f g sur [, + [, lors on pour tout x, x f(t) dt x g(t) dt et cette inéglité entre deux fonctions croissntes de x se conserve dns R + pr pssge à l limite qund x tend vers +. 136 Ch. Suquet, Cours I.P.É. 21
4.2. Espérnce d une vrible létoire positive En mjornt P (X s + ε) pr 1 sur [ ε, ] et pr P (X > s) sur [, + [, on en déduit que J ε + + P (X > s) ds = ε + I. L inéglité J I + ε étnt insi vérifiée pour tout ε >, on en déduit en fisnt tendre ε vers que J I. Remrque 4.15. Dns l démonstrtion ci-dessus, l positivité de X ne joue ucun rôle. Donc (4.15) reste vlble pour n importe quelle vrible létoire réelle X. Une dpttion fcile (fites l!) de l preuve ci-dessus montre que pour X vrible létoire réelle, on ussi P (X < t) dt = P (X t) dt. (4.16) Proposition 4.16 (inéglité de Mrkov). Si X est une vrible létoire positive, on x >, P (X x) EX x. (4.17) Remrques 4.17. Cette inéglité n d intérêt que lorsque le second membre est inférieur à 1, i.e. lorsque EX < + et x > EX. D utre prt il peut sembler un peu incongru de vouloir contrôler P (X x) à l ide de EX, puisque le clcul de cette espérnce pr l définition 4.1 présuppose l connissnce des P (X > t) pour t (dont on déduit fcilement les P (X t)). Il se trouve qu il rrive souvent en prtique que l on sche clculer EX sns connître, ou sns voir besoin de clculer, l loi de X. C est le cs pr exemple qund X est une somme finie de vribles létoires d espérnces connues. On peut ussi svoir mjorer EX sns connître l loi de X. Dns ces situtions, l inéglité de Mrkov est très utile. Pour ne citer qu un exemple, l inéglité de Mrkov est l un des outils pour étblir des «lois des grnds nombres». Voici mintennt 3 preuves de l inéglité de Mrkov, libre u lecteur de choisir celle qu il préfère. Preuve n o 1. Voir l figure 4.7. Preuve n o 2. Cette preuve ne fit que trduire explicitement l preuve grphique n o 1. Fixons x >, l quntité P (X x) devennt insi une constnte. À prtir de cette constnte, définissons l fonction h : [, + [ R +, t P (X x)1 [,x] (t). Pr décroissnce de l fonction t P (X t), on h(t) P (X t) pour tout t [, x]. D utre prt cette inéglité est ussi vérifiée pour tout t > x cr lors h(t) =. En intégrnt sur [, + [ l inéglité h(t) P (X t), on obtient compte-tenu de (4.15) : + h(t) dt + P (X t) dt = EX. Ch. Suquet, Cours I.P.É. 21 137
Chpitre 4. Espérnce y 1 y = P (X t) xp (X x) x t Fig. 4.7 Inéglité de Mrkov : xp (X x) + P (X t) dt = EX. D utre prt, puisque h est nulle sur ]x, + [, + h(t) dt = x P (X x) dt = xp (X x). Pr conséquent xp (X x) EX, ce qui nous donne (4.17) puisque x >. Preuve n o 3. Cette preuve plus bstrite exploite les propriétés déjà connues de l espérnce des v.. positives. On fixe x qui joue donc le rôle d une constnte dns toute l preuve. On prt de l inéglité entre v.. positives : x1 {X x} X (vérifiez) dont on déduit pr croissnce de E (proposition 4.13) : E ( x1 {X x} ) EX, puis grâce ux propositions 4.12 et 4.7, xp (X x) EX. On conclut en divisnt pr x >. Corollire 4.18. Si X est une vrible létoire positive, on l équivlence EX = P (X = ) = 1, utrement dit EX est nulle si et seulement si X est presque sûrement nulle. 138 Ch. Suquet, Cours I.P.É. 21
4.2. Espérnce d une vrible létoire positive Preuve. Supposons d bord que EX =. L v.. X étnt positive, l églité P (X = ) = 1 équivut à P (X > ) =. Introduisons l suite des évènements A n := {X 1/n}, n N. Cette suite est croissnte de réunion A := {X > }. Pr continuité séquentielle croissnte de P, P (A) = lim n + P (A n ). Or l inéglité de Mrkov ppliquée vec x = 1/n nous montre que pour tout n N, P (A n ) nex =. Ainsi P (A n ) = pour tout n et P (A) = comme limite de l suite nulle. Réciproquement, si P (X = ) = 1, lors pour tout t, P (X > t) =, d où EX = + dt =. Proposition 4.19 (inéglité de Mrkov rffinée). Si X est une vrible létoire positive intégrble (EX < + ), lim xp (X x) =. (4.18) x + Preuve. Voir l figure 4.8. y 1 y = P (X t) xp (X x) 2 x 2 x t Fig. 4.8 Preuve de (4.18) : xp (X x) + P (X t) dt = o(1) si EX < +. 2 x/2 Remrque 4.2. L réciproque de l proposition 4.19 est fusse. Il est possible que xp (X x) = o(1) sns que X soit intégrble. Un contre exemple élémentire est obtenu vec X de fonction de survie G(t) = P (X > t) = 1 si t 1 et 1/t si t > 1. Théorème 4.21 (pproximtion pr suite croissnte de v.. simples). Toute vrible létoire positive X sur (Ω, F) est limite simple sur Ω d une suite croissnte (X n ) n 1 de vribles létoires positives simples. Ch. Suquet, Cours I.P.É. 21 139
Chpitre 4. Espérnce Preuve. L idée est d utiliser pour construire X n, les vleurs pprochées dydiques pr défut de X u niveu de résolution n. On peut procéder comme suit en définissnt pour n N, les ensembles A n,k := X 1( [k2 n, (k + 1)2 n [ ), k n2 n 1; A n,n2 n := X 1( [n, + [ ). On prend lors Autrement dit, { n X n (ω) = k2 n si n X(ω), X n := n2 n k= k 2 n 1 A n,k. pour l unique entier k tel que k2 n X(ω) < (k + 1)2 n sinon. Comme X est mesurble, les A n,k sont dns F, ce qui entrîne l mesurbilité de X n (combinison linéires d indictrices d éléments de l tribu F). Comme X n (Ω) est une prtie finie de R +, X n est simple positive. Il reste à vérifier que pour tout ω Ω, l suite de réels ( X n (ω) ) est croissnte et n 1 converge dns R + vers X(ω). On note [x] l prtie entière du réel x, unique entier m tel que m x < m + 1. On voit que X n (ω) = n pour n [X(ω)] et que pour n > [X(ω)], X n (ω) = k(n, ω) { l = mx 2 n 2 ; l } n 2 X(ω), l N = 2 n [2 n X(ω)]. (4.19) n L suite finie ( X n (ω) ) n [X(ω)] est clirement croissnte. Voyons l suite ( X n (ω) ) n>[x(ω)]. D près (4.19), on X n (ω) = k(n, ω) 2 n = 2k(n, ω) 2 n+1 X(ω) 2k(n, ω) 2 n+1 k(n + 1, ω) 2 n+1 = X n+1 (ω), d où l croissnce de l suite ( X n (ω) ). Pour étblir définitivement l croissnce n>[x(ω)] de toute l suite ( X n (ω) ), il ne reste plus qu à exminer le point de rccord des deux n 1 sous-suites, donc à comprer X n (ω) et X n+1 (ω) pour n = [X(ω)]. Il suffit de remrquer que X n (ω) = n = (n2 n+1 )2 n 1 X(ω) et comme X n+1 (ω) est donné pr (4.19), on (n2 n+1 )2 n 1 k(n + 1, ω)2 n 1 = X n+1 (ω). L convergence est immédite, puisque pour n > [X(ω)], on d près (4.19) X n (ω) X(ω) < X n (ω) + 1 2 n, d où X(ω) X n (ω) < 2 n. Le théorème est démontré. On peut remrquer en bonus que l convergence est uniforme sur Ω si X est bornée (i.e. M := sup ω Ω X(ω) < + ). En effet pour n > M (constnte indépendnte de ω), on pour tout ω Ω, X(ω) X n (ω) < 2 n. 14 Ch. Suquet, Cours I.P.É. 21
4.2. Espérnce d une vrible létoire positive Lemme 4.22. Si (X n ) n 1 est une suite croissnte de vribles létoires positives ynt pour limite sur tout Ω l vrible létoire positive X, on t, P (X n > t) P (X > t). (4.2) Preuve. Pour t fixé, l suite des évènements A n := {X n > t} est croissnte pour l inclusion (puisque si ω A n, X n+1 (ω) X n (ω) > t, donc ω A n+1 ). Pr continuité séquentielle croissnte de P, P (A n ) tend en croissnt vers P (A), où A := n 1 A n. On prouve lors l convergence (4.2) en vérifint que A = {X > t}. Pour cel on montre l inclusion dns les deux sens. Soit ω A quelconque. Cel signifie qu il existe un n = n (ω) tel que ω A n, i.e. X n (ω) > t. Alors pr croissnce de l suite (X n (ω)) n 1, X n (ω) X n (ω) pour tout n n, d où en fisnt tendre n vers l infini, X(ω) X n (ω) > t. Donc en prticulier, X(ω) > t, d où ω {X > t}. Comme ω étit quelconque, ceci étblit l inclusion A {X > t}. Pour l inclusion inverse, soit ω quelconque dns {X > t}. Alors X(ω) > t et comme cette inéglité est stricte 9 et X n (ω) tend vers X(ω) qund n tend vers l infini, on peut trouver un n = n (ω) tel que pour tout n n, X n (ω) > t (si cel ne vous prît ps évident, posez ε = X(ω) t d où t = X(ω) ε). Ainsi ω A n pour tout n n, donc fortiori ω A. L inclusion {X > t} A est insi étblie et ceci termine l preuve du lemme. Théorème 4.23 (de Beppo Levi). Soit (X n ) n 1 une suite de vribles létoires positives qui converge en croissnt vers l vrible létoire positive X, i.e. pour tout n X n X n+1 et pour tout ω Ω, lim n + X n (ω) = X(ω). Alors l suite EX n converge en croissnt (dns R + ) vers EX. Preuve. L croissnce de l suite (EX n ) n 1 dns R + est évidente pr croissnce de l espérnce (proposition 4.13). Pour étudier s convergence, nous llons distinguer deux cs selon que X est ou n est ps intégrble. Cs 1, EX < +. Fixons ε > quelconque. Pr convergence de l intégrle de Riemnn générlisée + P (X > t) dt, on peut trouver un réel positif b (dépendnt de ε) tel que : + b P (X > t) dt < ε. (4.21) De cette églité et de l croissnce de (X n ) qui implique que X n X et donc que pour tout t, P (X n > t) P (X > t), on déduit : n 1, + b P (X n > t) dt < ε. (4.22) 9. C est là qu on voit pourquoi le lemme ne mrcherit ps vec P (X n t) et P (X t). Voici d illeurs un contre exemple élémentire. On prend X n = 1 1/n, v.. constnte et X = 1. Alors vec t = 1, on obtient P (X n 1) = pour tout n, tndis que P (X 1) = 1, ce qui empêche l convergence. Ch. Suquet, Cours I.P.É. 21 141
Chpitre 4. Espérnce Posons G n (t) := P (X n > t) et G(t) := P (X > t). Chque G n est une fonction décroissnte sur [, b] et pr le lemme 4.22, G n (t) converge vers G(t) pour tout t [, b]. L suite (G n ) stisfit insi les hypothèses du théorème d interversion limite et intégrle de Riemnn pour une suite de fonctions décroissntes (cf. théorème A.35), donc : b P (X n > t) dt n + b P (X > t) dt. (4.23) En combinnt (4.21), (4.22) et (4.23), on voit qu il existe un entier n (ε) tel que n n (ε), + P (X > t) dt + P (X n > t) dt < 2ε, ce qui étblit l convergence de EX n vers EX. Cs 2, EX = +. Il s git cette fois de montrer que EX n tend vers +. L divergence de l intégrle générlisée + P (X > t) dt signifie ici que x P (X > t) dt tend vers + qund x tend vers +. Donc si on fixe A > rbitrire, on peut trouver un b ], + [ tel que b P (X > t) dt > A. (4.24) En ppliqunt comme ci-dessus le théorème d interversion limite intégrle pour l suite de fonctions décroissntes (G n ), on obtient l convergence (dns R + ) de b P (X n > t) dt vers b P (X > t) dt qund n tend vers +. Il existe donc un entier n (A) tel que : n n (A), b P (X n > t) dt > A 2. (4.25) Ceci implique évidemment que n n (A), EX n = + P (X n > t) dt > A 2, et comme A est rbitrire, on insi prouvé que EX n tend vers +. L démonstrtion du théorème de Beppo Levi est chevée. Corollire 4.24 (dditivité de l espérnce). Si X et Y sont deux vribles létoires positives définies sur le même (Ω, F, P ), E(X + Y ) = EX + EY (églité dns R + ). (4.26) Preuve. On montre (4.26) pr un pssge à l limite à prtir de l dditivité de l espérnce des vribles simples. Cette propriété, déjà vue en Deug, est reprise sous une forme d hoc dns le lemme 4.25 ci-dessous. 142 Ch. Suquet, Cours I.P.É. 21
4.2. Espérnce d une vrible létoire positive Pr le théorème 4.21, il existe deux suites (X n ) et (Y n ) de vribles létoires simples positives telles que X n X et Y n Y. Alors en posnt Z n := X n + Y n, on ussi Z n X + Y. Pr le lemme 4.25, on n N, EZ n = E(X n + Y n ) = EX n + EY n. (4.27) En ppliqunt le théorème de Beppo Levi à chcune des suites (Z n ), (X n ) et (Y n ), on peut psser à l limite qund n tend vers + dns (4.27) pour obtenir (4.26). Lemme 4.25. Si X et Y sont deux vribles létoires positives simples, il en est de même pour Z := X + Y et on EZ = EX + EY. Preuve. Pr hypothèse X(Ω) et Y (Ω) sont des sous-ensembles finis de R + et il est clir qu il en v de même pour Z(Ω). Donc Z est une vrible létoire positive simple. Notons X(Ω) = {x 1,..., x l }, Y (Ω) = {y 1,..., y m }, Z(Ω) = {z 1,..., z n }. On voit fcilement, en prtitionnnt Ω suivnt toutes les vleurs possibles de Y, resp. de X, que P (X = x i ) = P (Y = y j ) = y j Y (Ω) x i X(Ω) P (X = x i et Y = y j ), (4.28) P (X = x i et Y = y j ). (4.29) Pour z k Z(Ω), l décomposition en union finie d évènements 2 à 2 disjoints 1 {Z = z k } = x i +y j =z k {X = x i et Y = y j }, nous donne P (Z = z k ) = x i +y j =z k P (X = x i et Y = y j ). (4.3) On obtient lors l conclusion souhitée pr le clcul suivnt dns lequel tous les Σ sont des sommes d un nombre fini de termes et où on utilise (4.28) (4.3) et l proposition 4.9 1. Pour z k Z(Ω) et certins couples (x i, y j ) tels que x i + y j = z k, il se peut qu il n existe ucun ω Ω tel que X(ω) = x i et Y (ω) = y j, l évènement {X = x i et Y = y j } est lors vide. Ch. Suquet, Cours I.P.É. 21 143
Chpitre 4. Espérnce ppliquée d bord à Z, puis à X et Y. EZ = z k P (Z = z k ) = z k P (X = x i et Y = y j ) z k Z(Ω) z k Z(Ω) x i +y j =z k = (x i + y j )P (X = x i et Y = y j ) z k Z(Ω) x i +y j =z k = (x i + y j )P (X = x i et Y = y j ) = = = x i X(Ω),y j Y (Ω) x i X(Ω),y j Y (Ω) + x i X(Ω),y j Y (Ω) x i X(Ω) + x i y j Y (Ω) y j Y (Ω) y j x i P (X = x i et Y = y j ) x i X(Ω) x i P (X = x i ) + y j P (X = x i et Y = y j ) P (X = x i et Y = y j ) P (X = x i et Y = y j ) x i X(Ω) y j Y (Ω) = EX + EY. y j P (Y = y j ) Corollire 4.26 (interversion série-espérnce). Soit (X k ) k N, une suite de vribles létoires positives définies sur (Ω, F). On suppose que pour tout ω Ω, l série + k= X k(ω) converge 11 dns R +. Alors l ppliction S : Ω R +, ω S(ω) := est une vrible létoire positive sur (Ω, F) et on ( + ) ES = E X k = cette églité ynt lieu dns R +. k= + k= + k= X k (ω), EX k, (4.31) Preuve. L ppliction S : Ω R + est bien définie, grâce à l hypothèse de convergence simple de l série sur tout Ω. Posons n n N, S n := X k. 11. Nous donnons ici une «version bridée» de l interversion série-espérnce. On pourrit se psser de cette hypothèse de convergence dns R +, en considérnt que cette série converge toujours dns R +. Il fudrit lors considérer qu une vrible létoire positive est une ppliction à vleurs dns R +, ce que nous vons évité de fire dns ce cours... k= 144 Ch. Suquet, Cours I.P.É. 21
4.2. Espérnce d une vrible létoire positive Les S n sont mesurbles F - Bor(R + ) comme sommes finies d pplictions mesurbles (les X k ). Comme S est limite simple sur tout Ω d une suite d pplictions mesurbles, elle est mesurble pour les tribus F - Bor(R + ), c est donc bien une vrible létoire positive. Pr dditivité de l espérnce (corollire 4.24, qui s étend pr une récurrence immédite à toute somme d un nombre fini de vribles létoires positives 12 ) on n n N, ES n = EX k (églité dns R + ). (4.32) k= En rison de l positivité des X k, l convergence de S n vers S est croissnte (S n S), donc pr le théorème de Beppo Levi, ES n converge vers ES qund n tend vers +. En fisnt tendre n vers + dns (4.32), on obtient lors l conclusion souhitée (noter que le second membre de (4.32) converge dns R + vers le second membre de (4.31)). Corollire 4.27 (espérnce d une v.. discrète positive). Pour toute vrible létoire discrète positive X, EX = xp (X = x), (églité dns R + ). (4.33) x X(Ω) Preuve. Puisque X est discrète positive, X(Ω) est une prtie finie ou dénombrble de R +. Le cs où X(Ω) est finie est celui des vribles létoires simples déjà trité ci-dessus (proposition 4.9). Supposons désormis X(Ω) dénombrble et indexons ses éléments pr les entiers : X(Ω) = {x k ; k N}. On peut lors représenter X comme l somme d une série de vribles létoires positives en écrivnt (l justifiction suit) : X = + k= x k 1 Ak, (A k := {X = x k }, k N). (4.34) En effet les évènements A k rélisent une prtition de Ω, donc pour tout ω Ω, il existe un unique indice j = j(ω) tel que ω A j et pour cet ω, X(ω) = x j. On lors + k= x k 1 Ak (ω) = x j 1 Aj (ω) = x j = X(ω), cr dns cette série de réels positifs, il y u plus un terme non nul 13, celui d indice j (pour k j, ω / A k, d où 1 Ak (ω) = ). Ceci prouve que l série de vribles létoires positives (4.34) converge sur tout Ω vers l vrible létoire positive X. Les hypothèses du corollire 4.26 étnt insi vérifiées, on EX = + k= E(x k 1 Ak ) = + k= x k E(1 Ak ) = + k= x k P (A k ) = + k= x k P (X = x k ), en utilisnt ussi les propositions 4.12 et 4.7. L formule (4.33) est insi démontrée. 12. Mis cette récurrence ne permet ps de triter le cs d une série. 13. Il se peut qu ils soient tous nuls si x j =. Ch. Suquet, Cours I.P.É. 21 145
Chpitre 4. Espérnce 4.3 Espérnce d une vrible létoire réelle L extension de l notion d espérnce u cs des vribles létoires réelles repose sur l décomposition X = X + X et l formule «EX := E(X + ) E(X )», sous réserve que cette soustrction it lieu dns R. Avnt d expliquer cel, donnons quelques précisions sur les vribles létoires positives X + et X. Elles sont définies pr X + := mx(, X), X := mx(, X). Notons que X + et X sont des vribles létoires 14 positives. En se rppelnt l définition 1.71, on donc : X + : Ω R +, ω X + (ω) = (X(ω)) +, X : Ω R +, ω X (ω) = (X(ω)). Au risque d insister lourdement, notons encore que pour tout ω Ω, { { X + X(ω) = X(ω) si X(ω), (ω) = X si X(ω), (ω) = si X(ω), X(ω) = X(ω) si X(ω). On en déduit les églités X = X + X, X = X + + X. Pour définir EX comme l différence E(X + ) E(X ), il est clir qu il nous fut interdire que ces deux espérnces de vribles létoires positives villent simultnément +. On pourrit utoriser l une des deux à vloir + à condition que l utre soit finie, EX prennt lors l vleur + si E(X + ) = + et E(X ) < +, ou dns le cs inverse EX =. Nous ne retiendrons ps cette option, cr le problème de «+» répprîtrit de toutes fçons pour l somme de deux vribles létoires, ce qui empêcherit l dditivité de l espérnce pour les vribles létoires réelles. Ainsi nous ne prlerons de l espérnce (sous-entendu dns R) de l vrible létoire réelle X que si E(X + ) < + et E(X ) < +, ou ce qui est équivlent si E X < +. Les propriétés de l espérnce étblies dns cette section ne concernent que les vribles létoires remplissnt cette condition 15. On dit que ces vribles létoires réelles sont intégrbles. Définition 4.28 (v.. réelle intégrble). L vrible létoire réelle X est dite intégrble si E X < +, utrement dit si : + P ( X > t) dt < +. 14. Elles héritent de l mesurbilité de X. 15. À titre exceptionnel, dns certines situtions, il peut être commode de dire qu une vrible létoire réelle une espérnce infinie si une seule des deux quntités E(X + ) et E(X ) est infinie, pr exemple dns l sitution de l remrque 4.3, pour rester cohérent vec l définition de l espérnce d une v.. positive comme élément de R +. Il convient lors de mnipuler ces «espérnces infinies» vec les plus grndes précutions. En tout étt de cuse, on ne prle jmis d espérnce ni finie ni infinie lorsque EX + et EX vlent tous deux +. 146 Ch. Suquet, Cours I.P.É. 21
4.3. Espérnce d une vrible létoire réelle Définition 4.29 (espérnce d une v.. réelle). Si X est une vrible létoire réelle intégrble, on ppelle espérnce de X, le réel EX défini pr EX := E(X + ) E(X ). (4.35) Le second membre de (4.35) bien un sens et représente un nombre réel, puisqu en rison des inéglités X + X et X X, l intégrbilité de X implique l finitude de E(X + ) et de E(X ). Remrque 4.3. Une fois le réel EX défini comme ci-dessus, on peut prler de s prtie positive (EX) + et de s prtie négtive (EX). Il fut prendre grde à ne ps les confondre vec E(X + ) et E(X ). Voici un exemple simple où ces quntités diffèrent. On prend X vrible létoire de Rdemcher, i.e. X(Ω) = { 1, 1} et P (X = 1) = P (X = 1) = 1/2. Comme X est bornée, elle est intégrble, donc EX existe. Comme l loi de X est symétrique, EX =, donc (EX) + = + = et (EX) = =. D utre prt, on vérifie (fites le!) que X + et X sont des vribles de Bernoulli de prmètre 1/2, donc E(X + ) = E(X ) = 1/2. L formule (4.35) ne semble ps très commode pour le clcul explicite de EX. On imerit pouvoir exprimer EX, directement à l ide de l loi de X, pr exemple de s f.d.r., sns psser pr l loi de X + et celle de X. C est l objet de l proposition suivnte. Proposition 4.31 (clcul de EX à l ide de l f.d.r.). Soit X une vrible létoire réelle intégrble de fonction de réprtition F. Son espérnce vérifie EX = + P (X > t) dt P (X < t) dt = + ( 1 F (t) ) dt F (t) dt. (4.36) Preuve. Compte-tenu des remrques fites u début de cette section, on vérifie fcilement pour tout t, les équivlences logiques suivntes : X + (ω) > t X(ω) > t, (4.37) X (ω) > t X(ω) < t. (4.38) Lissnt (4.37) u lecteur, détillons l deuxième. Comme t, l inéglité X (ω) > t implique que X (ω) est strictement positif, donc que X(ω) est strictement négtif et dns ce cs, X (ω) = X(ω), d où X(ω) > t et donc X(ω) < t. Ceci justifie l impliction dns (4.38). Réciproquement, si X(ω) < t, X(ω) est strictement négtif, donc X(ω) = X (ω), d où X (ω) < t et donc X (ω) > t. Les équivlences (4.37) et (4.38) nous donnent les églités d évènements {X + > t} = {X > t} et {X > t} = {X < t}, vlbles pour tout 16 t, d où : t, P (X + > t) = P (X > t), P (X > t) = P (X < t). (4.39) 16. Elles ne serient ps vlbles pour tout t réel, l positivité de t est utilisée dns l vérifiction de (4.37) et (4.38). Ch. Suquet, Cours I.P.É. 21 147
Chpitre 4. Espérnce y 1 E(X + ) y = F (t) E(X ) t Fig. 4.9 Espérnce d une v.. réelle EX := E(X + ) E(X ) En reportnt ces églités dns l définition de EX, on justifie le pssge à (4.4) dns le clcul suivnt : EX = E(X + ) E(X ) = = = = + + + + P (X + > t) dt P (X > t) dt P (X > t) dt + + ( 1 F (t) ) dt P (X > t) dt P (X < t) dt (4.4) P (X < s) ds (4.41) F (t) dt. (4.42) Le pssge de (4.4) à (4.41) résulte bien sûr du chngement de vrible s = t et justifie l première églité dns (4.36). Le pssge de (4.41) à (4.42) résulte de l remrque 4.15 et du remplcement de l «vrible muette s» pr t. Proposition 4.32 (espérnce d une v.. réelle à densité). Soit X une vrible létoire réelle de densité f. Alors X est intégrble si et seulement si et dns ce cs, + EX = x f(x) dx < + (4.43) + xf(x) dx. (4.44) 148 Ch. Suquet, Cours I.P.É. 21
4.3. Espérnce d une vrible létoire réelle Preuve. Nous svons déjà pr (4.39) et l remrque 4.11 que + P (X + > t) dt = + P (X > t) dt = + xf(x) dx = + x f(x) dx, (4.45) sns ucune condition d intégrbilité sur X. Cherchons une formule nlogue pour + P (X > t) dt. En utilisnt (4.39), le pssge de (4.4) à (4.41) et l remrque 4.15, on peut démrrer vec : + P (X > t) dt = P (X < t) dt = P (X t) dt. On procède lors comme dns l preuve de l proposition 4.1 en injectnt dns cette formule l églité P (X t) = t f(x) dx et en justifint l interversion des intégrtions pr le théorème de Fubini-Tonelli. P (X t) dt = = = = { t { { { } f(x) dx dt } 1 ],t] (x)f(x) dx dt } 1 [x,] (t)f(x) dt dx } 1 [x,] (t) dt f(x) dx. Comme pour x, 1 [x,](t) dt = dt = x, on obtient finlement : x + P (X > t) dt = ( x)f(x) dx = x f(x) dx. (4.46) En ppliqunt l dditivité de l espérnce des v.. positives à l églité X = X + + X et en rssemblnt (4.45) et (4.46), on voit que E X = E(X + ) + E(X ) = + x f(x) dx + x f(x) dx = + x f(x) dx, ce qui étblit l condition nécéssire et suffisnte d intégrbilité (4.43). Si cette condition est rélisée, E(X + ) et E(X ) sont finis et EX = E(X + ) E(X ) = ce qui étblit (4.44). + xf(x) dx ( x)f(x) dx = + xf(x) dx, Ch. Suquet, Cours I.P.É. 21 149
Chpitre 4. Espérnce Proposition 4.33 (espérnce d une v.. discrète). L vrible létoire discrète X est intégrble si et seulement si x P (X = x) < + (4.47) et dns ce cs, x X(Ω) EX = x X(Ω) xp (X = x), (4.48) cette somme désignnt une série bsolument convergente dns le cs où X(Ω) est infini 17. Preuve. X étnt discrète, X(Ω) est u plus dénombrble. Notons B := X(Ω) ], + [ et B := X(Ω) ], [. Alors X + (Ω) est égl à B si tous les x X(Ω) sont strictement positifs ou à B {} si l un u moins d entre eux est négtif ou nul 18. Quoiqu il en soit, on toujours en utilisnt le corollire 4.27 : E(X + ) = xp (X + = x) = xp (X = x), (4.49) x X + (Ω) x X + (Ω) xp (X = x) = x B puisque pour x = le terme éventuel xp (X = x) est nul. De même, X (Ω) = { x; x B } =: B si tous les x X(Ω) sont strictement négtifs ou à ( B ) {} si l un u moins d entre eux est positif ou nul. En ppliqunt le corollire 4.27 à l v.. positive discrète X, on : E(X ) = yp (X = y) = ( x)p (X = x) = x P (X = x). (4.5) x B x B y X (Ω) En rssemblnt (4.49) et (4.5), on obtient (noter que B B = ) : E X = xp (X = x)+ x P (X = x) = x P (X = x) = x B x B x B B x X(Ω) x P (X = x), ce qui nous donne l CNS d intégrbilité (4.47). Si cette condition est rélisée, E(X + ) et E(X ) sont finis et ce qui étblit (4.48). EX = E(X + ) E(X ) = x B xp (X = x) x B ( x)p (X = x) = xp (X = x) x B B = xp (X = x), x X(Ω) 17. X(Ω) est lors forcément dénombrble puisque X est discrète. 18. Il en résulte que X + (Ω) est u plus dénombrble et donc que l v.. positive X + est discrète. 15 Ch. Suquet, Cours I.P.É. 21
4.3. Espérnce d une vrible létoire réelle Proposition 4.34 (Linérité de l espérnce). ) L espérnce des v.. réelles intégrbles est dditive : si X et Y v.. réelles définies sur le même (Ω, F, P ) sont intégrbles, lors X + Y l est ussi et E(X + Y ) = EX + EY. (4.51) b) Si X est intégrble, cx l est ussi pour toute constnte réelle c et E(cX) = cex. (4.52) Preuve du ). Posons Z := X+Y. Alors Z est mesurble et compte-tenu de l croissnce et de l dditivité de l intégrle pour les v.. positives, l inéglité Z X + Y nous donne : E Z E( X + Y ) = E X + E Y < +. Ainsi Z est intégrble et EZ bien définie. L églité Z + Z = X + X + Y + Y, peut se réécrire comme églité entre sommes de v.. positives : Z + + X + Y = Z + X + + Y +. Pr dditivité de l espérnce pour les v.. positives, on en déduit E(Z + ) + (EX ) + E(Y ) = E(Z ) + E(X + ) + E(Y + ). L finitude de ces 6 espérnces (due à l intégrbilité de X, Y et Z) nous permet lors d écrire : E(Z + ) E(Z ) = E(X + ) E(X ) + E(Y + ) E(Y ), ce qui donne bien E(X + Y ) = EX + EY. Preuve du b). L intégrbilité de cx résulte de l intégrbilité de X et de l proposition 4.12 ppliquée vec l constnte positive c. En effet E cx = E( c X ) = c E X < +. Si c >, on voit que (cx) + = cx + et (cx) = cx. En utilisnt l proposition 4.12, on en déduit : E(cX) = E ( (cx) +) E ( (cx) ) = E(cX + ) E(cX ) = ce(x + ) ce(x ) = cex. Si c <, (cx) + = ( c)x et (cx) = ( c)x +, d où en utilisnt l proposition 4.12 vec l constnte positive ( c) : E(cX) = E ( (cx) +) E ( (cx) ) = E ( ( c)x ) E ( ( c)x +) Le cs c = est évident directement. = ( c)e(x ) ( c)e(x + ) = cex. Ch. Suquet, Cours I.P.É. 21 151
Chpitre 4. Espérnce Proposition 4.35 (espérnce et ordre). ) L espérnce des v.. réelles intégrbles est croissnte : si X et Y v.. réelles définies sur le même (Ω, F, P ) sont intégrbles et vérifient X Y, i.e. pour tout ω Ω, X(ω) Y (ω), lors EX EY. b) Si X est intégrble, X l est ussi et EX E X. (4.53) Preuve. Pour le ), il suffit de noter que si X Y, Y X est une v.. positive et donc E(Y X). Comme X et Y sont intégrbles, pr linérité de l espérnce, E(Y X) = EY EX. Ainsi l positivité de Y X et l linérité de E impliquent EY EX c est-à-dire EY EX. Une fois l croissnce de E insi étblie, on en déduit le b) en prtnt de l encdrement X X X qui implique E( X ) EX E X. Pr linérité E( X ) = E X, ce qui permet de réécrire l encdrement ci-dessus sous l forme : qui équivut à (4.53). E X EX E X, 4.4 Moments On étudie dns cette section les Eh(X), où h est une fonction réelle. Pour que l expression Eh(X) it un sens, il est nécessire que Y := h(x) soit une vrible létoire réelle. Cette condition ser rélisée si h : R R est borélienne, i.e. B = h 1 (B) Bor(R) pour tout B Bor(R). En effet on lors Y 1 (B) = {ω Ω; h(x(ω)) B} = {ω Ω; X(ω) h 1 (B)} = X 1 (B ) F, en rison de l mesurbilité F Bor(R) de l vrible létoire X. Comme le borélien B ci-dessus est quelconque, ceci montre que Y est elle ussi mesurble F Bor(R), i.e. que c est une vrible létoire sur (Ω, F). Ainsi si h est borélienne, E h(x) existe toujours comme élément de R + et si E h(x) < +, Eh(X) existe (et Eh(X) R). On pourr désigner E h(x) et Eh(X) respectivement pr l ppelltion h-moment bsolu de X et h-moment de X. Bien entendu si h est borélienne positive, h-moment bsolu et h-moment sont confondus et ce dernier existe toujours dns R +. Nous utiliserons ussi l ppeltion générique de moments fonctionnels pour désigner les h-moments 19. Le cs le plus utile est celui où h est une fonction puissnce, h(x) = x r, on prle lors de moment d ordre r de X. Définition 4.36. Soit r un réel positif. On ppelle moment bsolu d ordre r de l vrible létoire réelle X l quntité E( X r ) (élément de R + ). Si r est entier et X r 19. Attention, ces ppelltions ne sont ps stndrd, nous les doptons pour des risons de confort de rédction. 152 Ch. Suquet, Cours I.P.É. 21
4.4. Moments intégrble (donc si le moment bsolu d ordre r de X est fini), on ppelle moment d ordre r de X le réel E(X r ). On noter E X r pour E( X r ) et EX r pour E(X r ) en prennt grde de ne ps confondre ces quntités vec (E X ) r et (EX) r respectivement. Proposition 4.37. Si l vrible létoire X un moment bsolu d ordre r fini, elle ussi un moment bsolu d ordre p fini pour tout p [, r]. Preuve. Si p r, on les inéglités suivntes entre vribles létoires positives : X p 1 { X 1} + X r 1 { X >1} 1 + X r. Pr croissnce de l espérnce des v.. positives, on en déduit E( X p ) E(1) + E( X r ) = 1 + E( X r ) < +. L existence d un moment bsolu d ordre r fini donne un renseignement sur l vitesse de convergence vers de P ( X t) qund t tend vers +. On lors P ( X t) = O(t r ) pr le corollire suivnt de l inéglité de Mrkov. Proposition 4.38 (inéglité de Mrkov vec moment). Pour toute vrible létoire réelle X, on pour tout r >, t >, P ( X t) E X r t r. (4.54) Bien entendu, cette inéglité n d intérêt que si E X r < + et pour t tel que t r E X r < 1. Preuve. En utilisnt l croissnce de l ppliction R + R +, x x r et l inéglité de Mrkov pour l v.. positive X r, on obtient : P ( X t) P ( X r t r ) E X r t r. Proposition 4.39 (moments d une v.. discrète). Si X est une vrible létoire discrète, on pour tout réel r E X r = x r P (X = x). (4.55) x X(Ω) Si r est entier et E X r < +, on ussi EX r = x r P (X = x). (4.56) x X(Ω) Ch. Suquet, Cours I.P.É. 21 153
Chpitre 4. Espérnce Cette proposition n est qu une ppliction de l formule de clcul de Eh(X) pour X discrète qui est étblie dns toute s générlité à l proposition 4.41 ci-dessous. Proposition 4.4 (moments d une v.. à densité). Si X est une vrible létoire réelle à densité f, on pour tout réel r E X r = + Si r est entier et E X r < +, on ussi EX r = + x r f(x) dx. (4.57) x r f(x) dx. (4.58) Là ussi il s git d un cs prticulier d une formule générle pour Eh(X) lorsque X est à densité, donnée ci-dessous. L démonstrtion de cette formule générle étnt ssez rdue, nous invitons le lecteur à démontrer directement en exercice l proposition 4.4. L preuve est grndement fcilitée pr l monotonie de h : x x r sur chcun des ensembles R et R +. Proposition 4.41 (clcul de Eh(X), X discrète). Soit X une vrible létoire discrète et h : R R une ppliction borélienne (i.e. mesurble Bor(R) Bor(R)). Alors E h(x) = h(x) P (X = x). (4.59) x X(Ω) Si E h(x) < +, ce qui équivut à x X(Ω) h(x) P (X = x) < +, on de plus Eh(X) = h(x)p (X = x). (4.6) x X(Ω) Preuve. Posons Y = h(x). L ensemble X(Ω) = {x, x 1,...} est u plus dénombrble. L ppliction h n étnt ps supposée injective, il peut y voir des répétitions dns l suite des h(x k ). L ensemble Y (Ω) qui peut s écrire en effçnt toutes les répétitions de cette suite est lui-même u plus dénombrble. L vrible létoire Y = h(x) étnt discrète positive, l formule étblie u corollire 4.27 nous donne : E h(x) = EY = yp (Y = y). (4.61) y Y (Ω) Pour chque réel y de Y (Ω), notons B y l ensemble de ses ntécédents pr h : B y = {x X(Ω); h(x) = y}, y Y (Ω). Ce sous-ensemble de X(Ω) contient u moins un élément et est u plus dénombrble. On peut lors décomposer l événement {Y = y} en réunion disjointe (d une fmille u plus dénombrble) : {Y = y} = x B y {X = x}. 154 Ch. Suquet, Cours I.P.É. 21
4.4. Moments Le terme générl de l série (4.61) peut donc s écrire : yp (Y = y) = y x B y P (X = x) = x B y yp (X = x) = x B y h(x) P (X = x). Comme les B y forment une prtition de X(Ω), on en utilisnt l propriété de sommtion pr pquets des séries à termes positifs : h(x) P (X = x) = h(x) P (X = x) = yp (Y = y), x B y x X(Ω) y Y (Ω) y Y (Ω) ce qui, compte-tenu de (4.61), étblit l formule (4.59) pour E h(x). Supposons mintennt que E h(x) < +. Alors grâce à (4.59), on voit que l fmille de réels {h(x)p (X = x) ; x X(Ω)} est sommble. On peut lors reprendre le clcul fit ci-dessus en remplçnt prtout h pr h, cr les séries concernées sont bsolument convergentes et on peut utiliser l propriété de sommtion pr pquets des fmilles sommbles. On boutit insi à l formule (4.6) pour Eh(X). Proposition 4.42 (clcul de Eh(X), X à densité). Soit X une vrible létoire de densité f et h : R R une ppliction réglée sur tout intervlle fermé borné de R. Alors Si E h(x) < +, on de plus E h(x) = Eh(X) = + + h(x) f(x) dx. (4.62) h(x)f(x) dx. (4.63) Une ppliction h est réglée sur [, b] si elle est limite uniforme sur [, b] d une suite de fonctions en escliers 2. On démontre en nlyse que h est réglée sur [, b] si et seulement si elle dmet en tout point de ], b[ une limite à guche et une limite à droite (finies) insi qu une limite à droite finie en et à guche finie en b. L clsse des fonctions réglées, sns être ussi grnde que celle des fonctions boréliennes, devrit donc suffire à nos besoins. Elle contient en prticulier les fonctions continues et les fonctions monotones pr morceux. Schém de l preuve. On procède en 5 étpes. 1. On exmine d bord le cs de h en escliers et positive sur [, b], nulle en dehors de [, b]. L fonction h peut lors s écrire h = m i=1 y i1 Ai, où les y i sont des réels positifs et les A i sont des intervlles formnt une prtition de [, b]. Pr linérité, on se rmène u cs encore plus simple où h = 1 Ai, lequel est évident, puisque + 1 A i (x)f(x) dx = P (X A i ) = E1 Ai (X). 2. On en déduit ici l mesurbilité de h en montrnt qu elle est limite simple sur R d une suite de fonctions en esclier, donc boréliennes. Ainsi h(x) est bien une vrible létoire cr mesurble F Bor(R) pr composition. Ch. Suquet, Cours I.P.É. 21 155
Chpitre 4. Espérnce 2. On trite ensuite le cs où h est réglée et positive sur un intervlle fixé [, b], et nulle en dehors de cet intervlle. Elle est donc limite uniforme sur [, b] d une suite (g k ) k 1 de fonctions en escliers positives sur [, b] et nulles en dehors de [, b]. Comme les g k et h sont nulles en dehors de [, b], cette convergence est uniforme sur R et on en déduit (exercice) que Eh(X) = lim k Eg k (X). Notons u pssge que h est bornée, donc que l vrible létoire positive h(x) une espérnce finie. D utre prt l convergence uniforme sur [, b] de g k vers h permet de légitimer l interversion limite intégrle b h(x)f(x) dx = b lim k + g k (x)f(x) dx = lim k + b g k(x)f(x) dx = lim k + Eg k (X) et on obtient insi (4.63) pour h réglée positive sur [, b] et nulle en dehors 21. 3. Pour h positive réglée sur tout [, b] R, on pose h n := h1 [ n,n] et on note que h n h. On étend lors le résultt du cs 2 (vlble pour chque h n ) en utilisnt le théorème de Beppo Levi (Th. 4.23). 4. En ppliqunt ce qui précède vec h u lieu de h, on obtient (4.62) pour h réglée sur tout [, b] R sns condition de positivité. 5. On obtient enfin (4.63) en écrivnt h = h + h, en utilisnt le cs 3 et en recollnt les morceux, sns problème puisqu ici les intégrles générlisées et les espérnces concernées sont toutes finies. Nous présentons mintennt une formule injustement méconnue, permettnt de clculer des moments fonctionnels à prtir de l fonction de survie. Son intérêt est de permettre un tel clcul pour des vribles létoires qui ne sont ni discrètes ni à densité. Proposition 4.43. Soient X une vrible létoire positive et g une ppliction continue strictement croissnte R + R, de clsse C 1 sur R +. Alors Eg(X) = g() + + P (X > s)g (s) ds. (4.64) L preuve de cette formule utilise le lemme suivnt, vlide sous des hypothèses plus générles pour g. Lemme 4.44. Soit g : [, + [ R une ppliction continue et strictement croissnte sur [, + [. Notons l l limite de g en +. Alors pour toute vrible létoire positive X, t [g(), l[, P ( g(x) > t ) = P ( X > g 1 (t) ), (4.65) Preuve du lemme. En rison de s croissnce, g une limite l en +, qui est soit un réel, soit +. En rison de s continuité et de s croissnce stricte, g rélise une bijection de [, + [ sur [g(), l[ et l réciproque g 1 de cette bijection est définie et strictement 21. Attention, l interversion limite intégrle ne s obtient ps directement pr convergence uniforme de g k f vers hf, cr f n est ps forcément définie sur tout [, b] ni bornée. 156 Ch. Suquet, Cours I.P.É. 21
4.4. Moments croissnte sur [g(), l[. Pour prouver (4.65), nous llons étblir l églité des évènements A := {g(x) > t} et B := {X > g 1 (t)} en vérifint l inclusion dns les deux sens. Pour tout ω A, g(x(ω)) > t et, comme les deux membres de cette inéglité pprtiennent à [g(), l[ qui est l ensemble de définition de l ppliction strictement croissnte g 1, on en déduit que g 1( g(x(ω)) ) > g 1 (t), ce qui s écrit ussi X(ω) > g 1 (t). Ainsi tout ω dns A pprtient ussi à B, utrement dit, A B. En échngent les rôles de g et g 1, le même rgument montre que B A. Finlement A = B et P (A) = P (B). Preuve de l proposition 4.43. On ne perd ps de générlité en supposnt que g est positive. En effet pr croissnce de g, g g() est positive et il est clir que si (4.64) est vrie pour g g(), elle est vrie pour g. Pour étblir (4.64) vec g positive, on définit l vrible létoire positive Y = g(x) et on prt de l définition EY = + P (Y > t) dt en découpnt + = g() + l si g() l = +, ou + = g() + l + + si l < +. g() l Remrquons d bord que si l < +, l ppliction strictement croissnte g ne peut prendre que des vleurs strictement inférieures à l et pr conséquent pour tout t l, {g(x) > t} =, d où P (Y > t) = P ( ) = et + P (Y > t) dt =. Que l soit fini ou l non, on donc dns tous les cs : EY = g() P (Y > t) dt + l g() P (Y > t) dt. Exminons mintennt l première intégrle. Puisque g est croissnte, on pour tout ω Ω, Y (ω) = g(x(ω)) g() et donc pour tout t [, g()[, 1 P (Y > t) P (Y g()) = 1. L fonction t P (Y > t) est donc constnte égle à 1 sur [, g()[ et s vleur en g() est un réel 22 de [, 1]. L intégrle de Riemnn g() P (Y > t) dt vut donc g() 1 dt = g(). À ce stde nous vons donc étbli l formule : Eg(X) = g() + l g() P (Y > t) dt. En utilisnt (4.65) on peut écrire cette dernière intégrle sous l forme : l g() P (Y > t) dt = l g() P ( X > g 1 (t) ) dt. On peut lors ppliquer le chngement de vrible C 1 et croissnt 23 (cf. prop. A.33) t = g(s) ou s = g 1 (t) qui donne : l g() P (Y > t) dt = + P (X > s)g (s) ds 22. Cette vleur peut être strictement inférieure à 1 si P (X = ). Mis en tout étt de cuse, elle n ucune influence sur l vleur de l intégrle de Riemnn g() P (Y > t) dt. 23. Pour le justifier proprement, on peut d bord fire le chngement de vrible sur g(b), puis fire g() tendre b vers +. Ch. Suquet, Cours I.P.É. 21 157
Chpitre 4. Espérnce et chève l vérifiction de (4.64). Le h-moment Eh(X) pour h : x (x EX) 2 occupe une plce prticulière dns l théorie des probbilités. Définition 4.45 (vrince et écrt type). Si X est de crré intégrble (i.e. EX 2 < + ), on ppelle vrince de X le réel positif noté Vr X défini pr Vr X := E(X EX) 2. (4.66) On ppelle lors écrt type de X le réel σ(x) := (Vr X) 1/2. Remrquons que si EX 2 est fini, E X l est ussi (proposition 4.37), donc EX est bien défini. De plus (X EX) 2 = X 2 2(EX)X + (EX) 2 pprît lors comme une combinison linéire de trois vribles 24 intégrbles, donc est ussi intégrble. Ainsi l v.. positive (X EX) 2 est intégrble et E(X EX) 2 est bien un réel positif, ce qui justifie l définition 4.45. Notons ussi que si X représente une grndeur physique, X, EX et σ(x) ont l même unité, mis ps Vr X. Lorsqu elle existe, l vrince de X est une fçon de mesurer l dispersion de l loi de X utour de l espérnce. Les risons de l importnce de l vrince pprîtront ultérieurement dns ce cours (inéglité de Tchebycheff, théorème limite centrl). L ppliction des propositions 4.41 et 4.42 nous donne (sous réserve d intégrbilité de X 2 ) les formules respectives : Vr X = (x EX) 2 P (X = x) (cs X discrète), (4.67) Vr X = x X(Ω) + (x EX) 2 f(x) dx (cs X à densité f). (4.68) Dns l prtique, ces formules sont rrement utilisées, on leur préfère l formule suivnte qui simplifie les clculs. Proposition 4.46 (formule de Koenig pour l vrince). Si l vrible létoire X est de crré intégrble, Vr X = EX 2 (EX) 2. (4.69) Preuve. Rppelons que nous notons EX 2 pour E(X 2 ) et que le second membre de l formule ci-dessus n est donc générlement ps nul. On pose c = EX. Vr X = E(X c) 2 = E[X 2 2cX + c 2 ] = EX 2 2cEX + Ec 2 = EX 2 2c 2 + c 2 = EX 2 c 2, en utilisnt l linérité de l espérnce et l espérnce d une constnte. 24. À svoir X 2, X et l v.. constnte (EX) 2. 158 Ch. Suquet, Cours I.P.É. 21
4.4. Moments Proposition 4.47 (trnsltion et chngement d échelle). Si X un moment d ordre 2, R, b R, Vr(X + b) = 2 Vr X, σ(x + b) = σ(x). (4.7) Preuve. On en utilisnt l définition 4.45, l linérité de l espérnce et le fit que l espérnce de l constnte b est b : Vr(X + b) = E[X + b E(X + b)] 2 = E[X + b EX b] 2 = E[(X EX)] 2 = E[ 2 (X EX) 2 ] = 2 E[(X EX) 2 ] = 2 Vr X. Il est clir d près l définition de l vrince que l vrince d une constnte est nulle. L réciproque est presque vrie : Proposition 4.48 (nullité de l vrince et constnce p.s.). Vr X = X = EX p.s. X est presque sûrement constnte. (4.71) Preuve. Les implictions de droite à guche dns (4.71) sont déjà cquises. On sit en effet que l espérnce d une constnte est cette constnte et que si l v.. Y := (X EX) 2 vut vec probbilité 1, son espérnce est nulle 25. Pour l première impliction de guche à droite, il suffit d ppliquer le corollire 4.18 à l v.. positive Y. L deuxième impliction est trivile. 25. En effet, pour tout t, P (Y > t) =, donc Y étnt positive, EY = + P (Y > t) dt =. Ch. Suquet, Cours I.P.É. 21 159
Chpitre 4. Espérnce 16 Ch. Suquet, Cours I.P.É. 21
Chpitre 5 Vecteurs létoires et indépendnce L informtion pertinente résultnt d une expérience létoire ne se résume ps toujours à l vleur prise pr une seule vrible létoire réelle. On souvent besoin de connître les vleurs d une suite finie de vribles létoires. Pr exemple u jeu de 421, on lnce trois dés et on besoin de connître les points ffichés pr chcun des dés, le résultt ser donc décrit pr un vecteur (X 1 (ω), X 2 (ω), X 3 (ω)). Si on tire sur une cible, le résultt ser décrit pr les coordonnées (X(ω), Y (ω)) du point d impct. Si on étudie le fonctionnement d un guichet en observnt les n premiers clients, le résultt ser décrit pr l suite des X 1, Y 1, Z 1, X 2, Y 2, Z 2,... X n, Y n où X i est le temps d ttente u guichet du i e client, Y i son temps de service et Z i le temps s écoulnt entre le déprt du i e client et l rrivée du (i + 1) e. Ces suites finies de vribles létoires sont ppelées des vecteurs létoires. De même qu une vrible létoire peut être vue comme un procédé de choix d un nombre réel u hsrd, un vecteur létoire de dimension d, X = (X 1,..., X d ) est un procédé de choix u hsrd d un point de R d. Ses composntes X 1,..., X d sont lors utnt de vribles létoires réelles. Arrivé là, l étudint inquiet du nombre de pges de ce document qu il lui reste à lire vnt l exmen se demnde légitimement s il y un intérêt à conscrer tout un chpitre ux vecteurs létoires puisque ces objets ne sont que des suites finies de vribles létoires et que ces dernières sont mintennt bien connues 1. L intérêt de cette étude repose sur l remrque informelle suivnte à lquelle nous donnerons bientôt un sens mthémtique précis : l connissnce probbiliste globle du vecteur X = (X 1,..., X d ) pporte dvntge d informtion que l connissnce probbiliste individuelle de chcune de ses composntes X i. Au premier bord, cette idée peut prître choqunte cr une lecture rpide de l phrse précédente lisse croire que l connissnce de X(ω) pporte quelque chose de plus que celle de tous les X i (ω), i = 1,..., d, ce qui n est évidemment ps vri. L clé de l énigme est dns l expression «connissnce probbiliste» que nous remplcerons bientôt pr connissnce de l loi, dès que nous urons défini l loi d un vecteur létoire. En ttendnt voici une imge qui peut nous ider à comprendre ce dont il s git. Considérons un ensemble de 1 coureurs de fond, chcun muni d un dossrd numéroté de 1 à 1. Si on les rssemble sur une même piste pour une épreuve de 5 mètres, on peut représenter le résultt de l 1. Phrse écrite près une période de deux mois sns lecture d un pquet de copies... 161
Chpitre 5. Vecteurs létoires et indépendnce course pr le vecteur (X 1,..., X 1 ), où X i désigne le temps mis pr le coureur numéroté i pour prcourir les 5 mètres. Tout mteur d thlétisme sit bien que cette expérience n est ps équivlente à fire courir isolément un 5 mètres à chcun des 1 coureurs sur des stdes séprés. L différence ici vient de l compétition, de l tctique de course, etc. Pr contre dns d utres situtions, le comportement globl du vecteur des d composntes se réduit u comportement individuel de chcune d elles. On dmet générlement que c est le cs lorsqu on lnce trois dés en considérnt qu il revient u même de les lncer ensemble sur l même tble ou séprément sur trois tbles. On prle lors d indépendnce des composntes. Cette notion d indépendnce des composntes X i du vecteur létoire X est reliée à celle d une suite d évènements A i, où l rélistion ou non de A i ne dépend que des vleurs de X i. L étude des suites finies de vribles létoires indépendntes prend donc plce nturellement dns ce chpitre comme le cs prticulier des vecteurs létoires à composntes indépendntes. Suf mention explicite du contrire, toutes les vribles létoires et tous les vecteurs létoires considérés dns ce chpitre seront définis sur le même espce probbilisé (Ω, F, P ). 5.1 Vecteurs létoires 5.1.1 Générlités Définition 5.1 (vecteur létoire de R d ). On dit que l ppliction X : Ω R d est un vecteur létoire sur (Ω, F) si c est une ppliction mesurble F Bor(R d ). Proposition 5.2. Soit X un vecteur létoire sur (Ω, F) et P une probbilité sur (Ω, F). L fonction d ensembles P X = P X 1 définie sur Bor(R d ) pr B Bor(R d ), P X (B) := P ( X 1 (B) ) = P (X B) (5.1) est une probbilité sur ( R d, Bor(R d ) ). L preuve est exctement l même que celle de l proposition 3.7, en remplçnt les boréliens de R pr ceux de R d. Comme pour les vribles létoires, cette proposition légitime l définition de l loi de X sous P. Définition 5.3 (loi d un vecteur létoire). Soient (Ω, F, P ) un espce probbilisé et X : Ω R d un vecteur létoire sur (Ω, F). On ppelle loi de X sous P, ou plus simplement loi de X, l probbilité P X sur ( R d, Bor(R d ) ) définie pr (5.1). Proposition 5.4 (lois mrginles). Si X = (X 1,..., X d ) est un vecteur létoire sur (Ω, F), chcune de ses composntes X i (1 i d) est une vrible létoire réelle sur (Ω, F). L loi de X i est ppelée i e loi mrginle de X et est donnée pr : B i Bor(R), P Xi (B i ) = P (X i B i ) = P (X R i 1 B i R d i ). (5.2) 162 Ch. Suquet, Cours I.P.É. 21
5.1. Vecteurs létoires Preuve. L mesurbilité F Bor(R) de X i s obtient pr composition à prtir de l mesurbilité F Bor(R d ) de X. En effet X i = π i X, où π i : (x 1,..., x d ) x i est l i e projection cnonique de R d sur R ; comme π i est continue, elle est borélienne, c est-à-dire ici mesurble Bor(R d ) Bor(R). Donc X i est bien une vrible létoire. Pour vérifier (5.2), il suffit de remrquer que l équivlence X i B i X R i 1 B i R d i entrîne l églité des évènements correspondnts et de leur probbilité. Exemple 5.5. Soit X = (X 1, X 2 ) un vecteur létoire de loi uniforme sur [, 1] 2. Alors les lois mrginles P X1 et P X2 sont égles à l loi uniforme sur [, 1]. Exercice! Remrque 5.6 (d importnce cpitle). Une conséquence de l proposition 5.4 est que l connissnce de l loi du vecteur létoire X détermine complètement celle de ses lois mrginles. L réciproque est fusse. On peut même ffirmer sns hésiter qu il est impossible de comprendre l notion de vecteur létoire tnt que l on n ps ssimilé ce fit. L comprison de l exemple 5.7 ci-dessous vec l exemple 5.5 permet de voir que l connissnce des lois mrginles d un vecteur ne détermine ps l loi du vecteur. Exemple 5.7. Prenons une vrible létoire réelle Y 1 de loi uniforme sur [, 1] et posons Y 2 := Y 1 et Y := (Y 1, Y 2 ). Le vecteur létoire Y pr construction les mêmes lois mrginles que le vecteur X de l exemple 5.5. Notons := {(s, t) [, 1] 2 ; s = t} l première digonle du crré unité. Il est clir pr construction que P (Y ) = 1. 1 1 X 2 (ω) X(ω) Y 2 (ω) Y (ω) X 1 (ω) 1 Y 1 (ω) 1 Fig. 5.1 Ensembles de probbilité 1 pour les lois P X et P Y D un utre côté, P (X ) =, cr le segment est de λ 2 mesure nulle. Ceci empêche que X et Y ient même loi. L figure 5.2 propose une illustrtion en ffichnt le résultt de l simultion du choix «u hsrd» de 5 points suivnt l loi P X puis suivnt l loi P Y. L justifiction mthémtique des méthodes de simultion ser étudiée dns le cours d Initition à l Sttistique 2. 2. Ici on utilisé le générteur de nombres létoires du logiciel METAPOST vec lequel l pluprt des figures de ce document sont rélisées. Comme le code correspondnt est inclus dns le source L A TEX 2ε de ce document, le choix des points létoires vrie à chque compiltion. Ceci explique que l figure que vous voyez sur le document ppier entre vos mins n est ps forcément l même que sur le Web. Ch. Suquet, Cours I.P.É. 21 163
Chpitre 5. Vecteurs létoires et indépendnce Fig. 5.2 5 points choisis u hsrd suivnt l loi P X, puis suivnt l loi P Y Définition 5.8 (vecteur létoire discret). Le vecteur létoire X de R d est dit discret si X(Ω) est une prtie u plus dénombrble de R d. Il est clir que l loi de X s écrit lors P X = x X(Ω) P (X = x)δ x. Les vribles létoires mrginles X i de X = (X 1,..., X d ) sont lors des vribles létoires discrètes. En effet, soit π i, l restriction à X(Ω) de l projection cnonique sur l i-ième composnte de R d. Cette ppliction rélise une surjection de X(Ω) sur X i (Ω). Pr l proposition 1.41, on en déduit que X i (Ω) est u plus dénombrble. Exemple 5.9 (lois multinomiles). Le vecteur létoire N suit l loi multinomile de prmètres n et (p 1,..., p d ) où n N et les p i sont strictement positifs et de somme 1 si pour tout d-uple (j 1, j 2,..., j d ) d entiers tels que j 1 + j 2 + + j d = n, P { N = (j 1, j 2,..., j d ) } = n! j 1! j 2!... j d! pj 1 1 p j 2 2... p j d d. Ici l ensemble N(Ω) = {(j 1, j 2,..., j d ) N d ; j 1 + j 2 + + j d = n} est fini et on vérifie grâce à l formule du multinôme, cf. prop. 1.23, que x N(Ω) P (N = x) = j 1 + +j d =n n! j 1! j 2!... j d! pj 1 1 p j 2 2... p j d d = ( p 1 + + p d ) n = 1 n = 1. L loi multinomile est celle du vecteur des résultts d une suite d épreuves répétées indépendntes ynt chcune d issues possibles de probbilités respectives p 1,..., p d. On pourr justifier cette ffirmtion en exercice. Pr exemple considérons 2 tirges d une boule vec remise dns une urne contennt 1 boule bleue, 3 junes, 4 rouges et 2 vertes. Notons N = (N 1, N 2, N 3, N 4 ) où N i est le nombre de boules de l couleur i en numérotnt les couleurs pr ordre lphbétique (b,j,r,v). On (p 1, p 2, p 3, p 4 ) = ( 1, 3 4, 2 ). L 1 1 1 1 probbilité d obtenir en 2 tirges 3 bleues, 5 junes, 1 rouges et 2 vertes est P ( N = (3, 5, 1, 2) ) 2! 1 3 ( 3 5 ( 4 1 ( 2 ) 2 =,4 745. 3! 5! 1! 2!( 1) 1) 1) 1 164 Ch. Suquet, Cours I.P.É. 21
5.1. Vecteurs létoires Certines lois de vecteurs létoires ont une «densité» pr rpport à l mesure de Lebesgue de R d. Nous donnons ci-dessous une définition volontirement restrictive des densités sur R d, restnt dns le cdre de l intégrtion u sens de Riemnn. Même dns ce cdre, cette définition n est ni l seule possible ni l plus générle. Elle devrit nénmoins suffire pour les exemples cournts. Définition 5.1 (densité de probbilité sur R d ). On ppelle densité de probbilité sur R d toute fonction f vérifint ) f est définie et positive sur R d \ H, où H est une réunion finie (éventuellement vide) d hyperplns de R d ; b) f est loclement Riemnn intégrble 3 sur R d \ H ; c) l intégrle générlisée de f sur R d converge 4 et f(t) dt = f(t 1,..., t d ) dt 1... dt d = 1. R d R d Définition 5.11 (vecteur létoire à densité). Soit f une densité de probbilité sur R d. On dit que le vecteur létoire X de R d pour densité f si pour tout pvé fermé borné C = [ 1, b 1 ] [ d, b d ], P (X C) = f(t 1,..., t d ) dt 1... dt d. C Comme l clsse des pvés fermés bornés engendre l tribu borélienne de R d, on peut montrer que si deux vecteurs létoires X et Y ont même densité f, ils ont même loi. Pr illeurs, si un vecteur létoire X dmet une densité f, celle-ci n est ps unique (si on l modifie en un point, on ne chnger ps l vleur des ses intégrles sur les pvés fermés bornés). Voici un premier exemple de vecteur létoire à densité. D utres seront vus ultérieurement. Exemple 5.12 (densité de l loi uniforme sur un borélien de R d ). Soit B un borélien de R d tel que < λ d (B) < +. Si le vecteur létoire X de R d suit l loi uniforme sur B, cf. exemple 2.26, il dmet pour densité l fonction f = 1 λ d (B) 1 B. 3. Cel signifie qu il existe une suite croissnte pour l inclusion (K n ) de compcts inclus dns R d \H, que cette suite épuise R d \ H et que f est Riemnn intégrble sur chque K n. On dit que K n épuise R d \ H si pour tout compct K R d \ H, il existe n tel que K K n. 4. Cel signifie que pour toute suite (K n ) épuisnt R d \ H, l suite K n f(t) dt une limite dns R. On montre qu lors cette limite ne dépend ps du choix de l suite (K n ) et on l note R d f(t) dt. On montre ussi qu une CNS pour l convergence de l intégrle générlisée de f est que pour une suite (K n ) prticulière, l suite de réels K n f(t) dt soit bornée. Ch. Suquet, Cours I.P.É. 21 165
Chpitre 5. Vecteurs létoires et indépendnce En effet, pour tout pvé fermé borné C = [ 1, b 1 ] [ d, b d ], on P (X C) = λ d(b C) 1 = 1 B C (t 1,..., t d ) dt 1... dt d λ d (B) λ d (B) R d 1 = 1 B (t 1,..., t d )1 C (t 1,..., t d ) dt 1... dt d λ d (B) R d 1 = 1 B (t 1,..., t d ) dt 1... dt d λ d (B) C = f(t 1,..., t d ) dt 1... dt d. C Le clcul ci-dessus utilise le fit que 1 B C = 1 B 1 C et l reltion λ d (A) = A dt 1... dt d = R d 1 A (t 1,..., t d ) dt 1... dt d pour tout borélien A. Nous touchons ici ux limittions de ce cours sur l théorie de l intégrle. En toute rigueur nous ne devrions écrire cette reltion que si 1 A vérifie les conditions ) et b) de l définition 5.1. En prtique nous n utiliserons l loi uniforme que sur des boréliens ssez simples pour lesquels ces conditions seront remplies. Comme dns le cs d = 1, on dispose d une condition suffisnte prtique pour vérifier que deux vecteurs létoires à densité n ont ps même loi. Lemme 5.13. Soient X et Y deux vecteurss létoires de R d dmettnt respectivement pour densité les fonctions f et g. On suppose qu il existe t R d tel que f(t ) g(t ) et que de plus, f et g sont toutes deux continues u point t. Alors X et Y n ont ps même loi. L preuve est essentiellement l même que celle du lemme 3.24, en remplçnt les intervlles ouverts pr des pvés ouverts et ser donc omise. Proposition 5.14 (densités mrginles). Si le vecteur létoire X de R d est à densité f, ses lois mrginles sont ussi à densité et pour i = 1,..., d, une densité de X i est donnée pr x i f Xi (x i ) = f(t 1,..., t i 1, x i, t i+1,..., t d ) dt 1... dt i 1 dt i+1... dt d. R i 1 R d i Preuve. On clcule P (X i [ i, b i ]) en utilisnt (5.2) : P (X i [ i, b i ]) = f(t 1,..., t d ) dt 1... dt d R i 1 [ i,b i ] R { d i } = f(t 1,..., t d ) dt 1... dt i 1 dt i+1... dt d dt i, [ i,b i ] R i 1 R d i pr le théorème de Fubini-Tonnelli. Comme i et b i sont quelconques, on en déduit que l fonction entre ccoldes ci-dessus est une densité de X i. En toute rigueur, il y ici un problème cr le théorème de Fubini-Tonnelli nous dit que cette fonction est définie suf peut-être sur un ensemble de mesure de Lebesgue nulle (où elle prend l vleur + ). En prtique nous ne rencontrerons ps de difficulté à ce sujet. 166 Ch. Suquet, Cours I.P.É. 21
5.1. Vecteurs létoires Exemple 5.15 (loi uniforme sur un disque). Soit D le disque unité de R 2 et X = (X 1, X 2 ) un vecteur létoire suivnt l loi uniforme sur D. D près l exemple 5.12, nous svons qu il dmet pour densité f = π 1 1 D. Clculons l densité mrginle f X1 fournie pr l proposition 5.14. 1 f X1 (x 1 ) = π 1 D(x 1, t 2 ) dt 2 = 1 + 1 D (x 1, t 2 ) dt 2. (5.3) π R Notons ici que l pprtennce à D du point (t 1, t 2 ) de R 2 est crctérisée pr l inéglité t 2 1 + t 2 2 1. On donc { { 1 si x 2 1 + t 2 2 1 1 si x 2 1 1 et t 2 2 1 x 2 1 1 D (x 1, t 2 ) = = sinon sinon D où ce qui peut ussi s écrire 1 D (x 1, t 2 ) = { 1 si x 1 1 et t 2 1 x 2 1, sinon, 1 D (x 1, t 2 ) = 1 [ 1,1] (x 1 )1 [ (1 x 2 1 )1/2,(1 x 2 1 )1/2 ] (t2 ). Géométriquement, ce petit clcul revient à chercher l intersection du disque D vec l droite verticle t 1 = x 1, où x 1 joue le rôle d une constnte, et à projeter cette intersection sur le deuxième xe, cf figure 5.3. En reportnt cette expression de 1 D (x 1, t 2 ) dns (5.14), on obtient f X1 (x 1 ) = 1 π + = 1 π 1 [ 1,1](x 1 ) = 1 π 1 [ 1,1](x 1 ) 1 [ 1,1] (x 1 )1 [ (1 x 2 1 )1/2,(1 x 2 1 )1/2 ] (t2 ) dt 2 + (1 x 2 1 ) 1/2 1 [ (1 x 2 1 )1/2,(1 x 2 1 )1/2 ] (t2 ) dt 2 (1 x 2 1 )1/2 dt 2. Cette dernière intégrle n est rien d utre que l longueur du segment défini pr ses bornes (rppelons que x 1 est considéré comme une constnte dns tout ce clcul). On boutit insi à f X1 (x 1 ) = 2 π (1 x2 1) 1/2 1 [ 1,1] (x 1 ). Pr rison de symétrie il est clir que X 1 et X 2 ont même loi et donc même densité, d où f X2 (x 2 ) = 2 π (1 x2 2) 1/2 1 [ 1,1] (x 2 ). L construction du grphe de f X1 est très simple : on l obtient en ppliqunt u demi cercle unité supérieur d éqution y = 1 x 2 1 l trnsformtion (x 1, y) (x 1, 2 y). On π obtient insi une moitié d ellipse. Un coup d oeil sur ce grphe devrit vous convincre que l loi de X 1, bien qu ynt toute s msse portée pr le segment [ 1, 1], n est ps l loi uniforme sur [ 1, 1]. Ch. Suquet, Cours I.P.É. 21 167
Chpitre 5. Vecteurs létoires et indépendnce t 2 1 y 2 π y = f X1 (x 1 ) x 1 1 1 t 1 1 1 x 1 1 Fig. 5.3 Densité mrginle f X1 de l loi uniforme sur le disque unité D On peut définir l fonction de réprtition F d un vecteur létoire pr x = (x 1,..., x d ), F (x) = P ( X ], x 1 ] ], x d ] ). Comme en dimension 1, l f.d.r. crctérise l loi. Ceci est lié u fit que l tribu Bor(R d ) est engendrée pr l clsse des ensembles de l forme ], x 1 ] ], x d ]. Nénmoins le rôle des f.d.r. en dimension d > 1 est bien moindre qu en dimension 1. On préfère crctériser l loi d un vecteur létoire pr une collection de h-moments Eh(X) (h : R d R) u sens suivnt. Proposition 5.16 (crctéristion pr les moments fonctionnels). L loi d un vecteur létoire X de R d est crctérisée pr l fmille de moments fonctionnels {Eh(X); h H}, où H est une clsse «suffismment riche» de fonctions boréliennes R d R. Autrement dit, les deux vecteurs létoires X et Y ont même loi si et seulement si Eh(X) = Eh(Y ) pour toute h H. Comme fmille H «suffismment riche», on peut prendre : l ensemble des fonctions boréliennes positives R d R +, l espce C b (R d ) des fonctions continues bornées R d R, l espce C c (R d ) des fonctions continues à support compct R d R. Preuve. L espce C c (R d ) étnt inclus dns C b (R d ), lui même inclus dns l ensemble des fonctions boréliennes positives R d R +, il suffit de fire l preuve pour H = C c (R d ). L prtie évidente est que l églité des lois des vecteurs létoires X et Y implique l églité des lois des vribles létoires réelles bornées h(x) et h(y ) et donc l églité de leur espérnce. Pour montrer l réciproque, on suppose désormis que h C c (R d ), Eh(X) = Eh(Y ). (5.4) Comme l loi d un vecteur létoire Z de R d est crctérisée pr les P (Z C), où C décrit l fmille des pvés ouverts de R d, il nous suffit de prouver que P (X C) = P (Y C) pour tout pvé ouvert C. 168 Ch. Suquet, Cours I.P.É. 21
5.1. Vecteurs létoires Soit donc C := d ] j, b j [, j=1 un pvé ouvert non vide de R d (on donc j < b j pour tout j). Définissons pour tout n n, tel que 2/n < min 1 j d (b j j ), l fonction continue à support compct h n pr h n (x) = h n (x 1,..., x d ) := h n,1 (x 1 )... h n,d (x d ), où h n,j est l unique fonction continue R [, 1], vlnt 1 sur [ j + 1/n, b j 1/n], hors de ] j, b j [ et ffine sur chcun des intervlles [ j, j + 1/n] et [b j 1/n, b j ], voir l figure 5.4. y 1 j j + 1 b b n j 1 n j x j Fig. 5.4 Fonction h n,j L fonction h n est continue, à support compct (son support est exctement le pvé fermé C). On remrque que pour tout j = 1,..., d, l suite de fonctions positives (h n,j ) n n est croissnte et converge en tout point de R vers l indictrice 1 ]j,b j [. On en déduit imméditement que pour tout x R d, l suite de réels positifs (h n (x)) n n converge en croissnt vers 1 C (x). Pr conséquent (h n (X)) n n et (h n (Y )) n n sont deux suites croissntes de vribles létoires positives qui convergent (sur tout Ω) respectivement vers 1 C (X) et 1 C (Y ). Comme pr l hypothèse (5.4), Eh n (X) = Eh n (Y ) pour tout n n, on en déduit en fisnt tendre n vers + et en ppliqunt le théorème de Beppo Levi que E1 C (X) = E1 C (Y ), ce qui s écrit ussi P (X C) = P (Y C). Il importe de svoir clculer les Eh(X) qund on connît l loi de X. Les formules sont nlogues à celles déjà données en dimension 1. Ch. Suquet, Cours I.P.É. 21 169
Chpitre 5. Vecteurs létoires et indépendnce Proposition 5.17 (clcul de Eh(X)). ) Si le vecteur létoire X est discret et si h est une fonction borélienne R d R, E h(x) = h(x) P (X = x). Si de plus E h(x) < +, Eh(X) = x X(Ω) x X(Ω) h(x)p (X = x). b) Si X est à densité f et h : R d R est continue bornée sur R d, Eh(X) = h(x)f(x) dx = R d h(x 1,..., x d )f(x 1,..., x d ) dx 1... dx d. R d Cette formule se générlise u cs où h est continue non bornée sur R d, sous réserve que R d h(x) f(x) dx < +. Nous donnons mintennt une formule de clcul de densité du vecteur létoire g(x) où X est un vecteur létoire à densité. Proposition 5.18 (densité d un vecteur létoire imge). Soit X = (X 1,..., X d ) un vecteur létoire de R d ynt une densité f X. On suppose de plus que D est un ouvert de R d tel que P (X D) = 1 et que g : D R d est C 1, injective vec un déterminnt jcobien Jc(g) qui ne s nnule en ucun point de D. Alors g rélise une bijection C 1 d inverse C 1 (utrement dit un C 1 -difféomorphisme) entre D et son imge D := g(d). Le vecteur létoire Y := g(x) dmet pour densité f Y (y) = f X ( g 1 (y) ) Jc(g 1 )(y) 1 D (y). Nous ne démontrerons ps cette proposition. L ffirmtion que g est un C 1 -difféomorphisme découle d un théorème d nlyse (théorème d inversion globle). Rppelons que le jcobien de g est donné pr ([ gi ) Jc(g) = det, x j ]i,j=1,...,d où les g i sont les pplictions coordonnées de g = (g 1,..., g d ), i.e. g i (x 1,..., x d ) = π i ( g(x1,..., x d ) ), π i étnt l projection cnonique sur l i e coordonnée dns R d. Pour clculer Jc(g 1 )(y), on peut soit utiliser l formule ci-dessus en remplçnt g pr g 1 et les x j pr les y j, soit utiliser l reltion Jc(g 1 )(y) = 1 Jc(g)(g 1 (y)). Un cs prticulier fcile et importnt est celui où g est une ppliction linéire bijective de R d sur R d. Dns ce cs, soit A = [ i,j ] l mtrice d d de g reltivement à 17 Ch. Suquet, Cours I.P.É. 21
5.1. Vecteurs létoires l bse cnonique de R d. Cette mtrice est inversible, son déterminnt est donc non nul. L i e composnte de g(x) est ici g i (x 1,..., x d ) = d j=1 i,jx j, d où i, j = 1,..., d, g i x j = i,j. On en déduit que le jcobien de g comme celui de g 1 sont constnts et vlent Jc(g) = det A = det(g), Jc(g 1 ) = 1 det A = 1 det g. Nous obtenons insi le corollire suivnt de l proposition 5.18, vec ici D = R d et D = g(d) = R d. Corollire 5.19 (chngement de vrible linéire). Soit X = (X 1,..., X d ) un vecteur létoire de R d ynt une densité f X et g : R d R d une ppliction linéire bijective. Alors le vecteur létoire Y := g(x) dmet pour densité 5.1.2 Covrince f Y (y) = 1 det g f ( X g 1 (y) ). Proposition 5.2 (inéglité de Cuchy-Schwrz). Si les vribles létoires réelles X et Y ont des moments d ordre 2, lors l vrible létoire XY est intégrble et E(XY ) (EX 2 ) 1/2 (EY 2 ) 1/2. (5.5) Preuve. L intégrbilité de l v.. XY résulte de l inéglité élémentire XY X 2 + Y 2. On remrque lors que l fonction trinômile suivnte de l vrible réelle t, g : t t 2 EY 2 + 2tE(XY ) + EX 2 = E(X + ty ) 2, est définie sur R et positive sur R. Ceci n est possible que si son discriminnt est négtif, ce qui s écrit = ( E(XY ) ) 2 (EX 2 )(EY 2 ), d où l inéglité (5.5). Définition 5.21 (covrince). Si les vribles létoires réelles X et Y ont des moments d ordre 2, on ppelle covrince du couple létoire (X, Y ) l quntité : Remrquons que Cov(X, X) = Vr X. Cov(X, Y ) = E [ (X EX)(Y EY ) ]. Proposition 5.22 (propriétés de l covrince). Les propriétés suivntes sont vérifiées pour tout couple (X, Y ) de v.. réelles ynt des moments d ordre 2. Ch. Suquet, Cours I.P.É. 21 171
Chpitre 5. Vecteurs létoires et indépendnce (i) Cov(X, Y ) = Cov(Y, X). (ii) Pour tous réels, b, c, d : Cov(X + b, cy + d) = c Cov(X, Y ). (iii) Cov(X, Y ) σ(x)σ(y ). L vérifiction est lissée u lecteur. Définition 5.23 (coefficient de corréltion). Si X et Y sont des vribles létoires réelles non constntes ynt des moments d ordre 2, on ppelle coefficient de corréltion entre X et Y l quntité : ρ(x, Y ) = Cov(X, Y ) σ(x)σ(y ). D près (iii) on toujours 1 ρ(x, Y ) 1. D utre prt il résulte fcilement du cs d églité dns l inéglité de Cuchy-Schwrz que ρ est mximl lorsque Y est une fonction ffine de X : Y = X + b. Qund ρ = (ce qui rrive en prticulier lorsque X et Y sont indépendntes), on dit que X et Y sont non corrélées. Proposition 5.24 (formule de Koenig pour l covrince). Si l covrince de X et Y existe, elle peut se clculer pr : Cov(X, Y ) = E(XY ) EXEY. Preuve. L vérifiction est nlogue à celle de l formule de Koenig pour l vrince (qui n est que le cs prticulier Y = X) et est lissée en exercice. Remrque 5.25 (clcul explicite de l covrince). Les formules de clcul des h- moments ppliquées u vecteur létoire (X, Y ) (prop. 5.17) et ux vribles létoires réelles X et Y (prop. 4.41 et 4.42) nous donnent pour l covrince (lorsqu elle existe) les formules explicites suivntes. Si (X, Y ) est discret, Cov(X, Y ) = xyp (X = x, Y = y) xp (X = x) yp (Y = y). (5.6) x X(Ω) y Y (Ω) x X(Ω) y Y (Ω) Si (X, Y ) est à densité f, en notnt f X et f Y les densités mrginles, + + Cov(X, Y ) = xyf(x, y) dx dy xf X (x) dx yf Y (y) dy. (5.7) R 2 Proposition 5.26 (vrince d une somme). Si X 1,..., X n sont des vribles létoires réelles ynt des moments d ordre 2, ( n ) n Vr X i = Cov(X i, X j ) (5.8) i=1 = i,j=1 n Vr X i + i=1 n Cov(X i, X j ). (5.9) i,j=1 i j 172 Ch. Suquet, Cours I.P.É. 21
5.2. Indépendnce de vribles et vecteurs létoires Dns le cs n = 2 (5.9) s écrit : Vr(X + Y ) = Vr X + Vr Y + 2 Cov(X, Y ). (5.1) Preuve. Pour n 2 quelconque, l identité lgébrique : ( n ) 2 n Y i = Y i Y j, i=1 i,j=1 utilisée vec Y i = X i EX i et l linérité de l espérnce nous donnent : ( n ) { n ( n )} 2 Vr X i = E X i E X i i=1 i=1 { n = E X i i=1 { n } 2 = E Y i = i=1 i=1 n } 2 EX i i=1 n E(Y i Y j ) = i,j=1 i,j=1 n Cov(X i, X j ). 5.2 Indépendnce de vribles et vecteurs létoires 5.2.1 Suites indépendntes Définition 5.27 (indépendnce de n vribles létoires). Les vribles létoires réelles X 1,..., X n définies sur le même (Ω, F, P ) sont dites indépendntes si : B 1,..., B n Bor(R), P ( X 1 B 1,..., X n B n ) = P (X1 B 1 )... P (X n B n ). (5.11) Remrques 5.28. 1. L condition (5.11) équivut à l indépendnce mutuelle des évènements {X 1 B 1 },..., {X n B n } pour tout choix des boréliens B i. En effet l liberté de choisir B i = R permet «d effcer» pour ce choix le rôle de X i et insi d obtenir à prtir de (5.11) une églité de même type pour l intersection de toute sousfmille finie des évènements considérés. L rédction détillée de l justifiction de cette équivlence est lissée en exercice. Le même rgument montre que l indépendnce de X 1,..., X n entrîne celle des X i1,..., X ik pour tout choix d indices 1 i 1 < i 2 < < i k n. 2. L indépendnce des X i, 1 i n est une propriété plus forte que leur indépendnce deux à deux. Ch. Suquet, Cours I.P.É. 21 173
Chpitre 5. Vecteurs létoires et indépendnce 3. Pour vérifier l indépendnce de X 1,..., X n, il suffit de tester l églité dns (5.11) pour des B i quelconques pris dns l une des sous-fmilles suivntes de Bor(R) : les intervlles ], b i ] ; les intervlles ] i, b i ] ; les intervlles ] i, b i [ ; les intervlles [ i, b i ] ; les intervlles ]b i, + [. Cette réduction repose essentiellement sur le fit que chcune de ces fmilles d intervlles engendre Bor(R) et est stble pr intersections finies (en utorisnt b i < i pour voir l ensemble vide dns chque fmille). Nous nous contenterons de cette justifiction pour ne ps trop sortir du cdre de ce cours. 4. Clirement l indépendnce n est ps ffectée pr une permuttion sur les indices i des vribles létoires. On peut donc prler d indépendnce d une fmille finie de vribles létoires sns se préoccuper de l ordre d indextion. L définition de l indépendnce se générlise comme suit à une fmille finie de vecteurs 5 létoires. Définition 5.29 (indépendnce de n vecteurs létoires). Pour i = 1,..., n, soient X i : Ω R d i des vecteurs létoires sur le même espce probbilisé (Ω, F, P ). On dit qu ils sont indépendnts si l églité P ( X 1 B 1,..., X n B n ) = P (X1 B 1 )... P (X n B n ) (5.12) est vérifiée pour tout choix des boréliens B i Bor(R d i ), i = 1,..., n. Notons qu vec cette définition, l collection de vecteurs létoires considérée peut être complètement hétéroclite qunt ux dimensions, y compris vec d i = 1 pour certines vleurs de i (les X i correspondnts étnt lors des vribles létoires réelles). Une propriété bien commode de l indépendnce des v.. est l hérédité. Avnt de l énoncer formellement, voyons s significtion sur un exemple. Supposons que les v.. réelles X 1,..., X 5 soient indépendntes. Alors les trois vribles létoires Y 1, Y 2, Y 3 suivntes sont indépendntes Y 1 := X 1 + X 2, Y 2 := X 3 sin X 4, Y 3 := exp(x 2 5 X 5 ). Il en v de même pour les vecteurs létoires Z 1, Z 2, Z 3 Z 1 := (X 1, X 2 ), Z 2 := (X 3 + cos X 4, X 2 4), Z 3 := (X 3 5, 2X 5, X 2 5). Nous énonçons le résultt à prtir d une suite de vribles létoires indépendntes pour ne ps trop lourdir les nottions, mis il se générlise à une fmille finie hétéroclite de vecteurs létoires indépendnts u sens de l définition 5.29. 5. Il v sns dire, mis mieux en le disnt, que l indépendnce des vecteurs dont il est question ici n rien à voir vec l indépendnce linéire! 174 Ch. Suquet, Cours I.P.É. 21
5.2. Indépendnce de vribles et vecteurs létoires Proposition 5.3 (hérédité de l indépendnce). Soient X 1,..., X n des vribles létoires réelles indépendntes. Découpons {1,..., n} en k blocs disjoints, en notnt m j le crdinl du j-ième bloc et n j = 1 l j m l, vec n :=. Pour j = 1,..., k, ssocions u j-ième bloc une fonction borélienne h j : R m j R d j. Posons enfin Z j := h j (X nj 1 +1,..., X nj ). Alors l suite finie (Z j ) 1 j k de vecteurs létoires est indépendnte (u sens de l définition 5.29). En prennt pour chque j, d j = m j et h j égle à l identité R m j l proposition 5.3 contient en prticulier le résultt suivnt. R m j, on voit que Corollire 5.31 (indépendnce des blocs disjoints). Si les X 1,..., X n sont des vribles létoires réelles indépendntes, les k «blocs disjoints» Y j := (X nj 1 +1,..., X nj ), où = n < n 1 < n 2 < < n k = n, sont des vecteurs létoires indépendnts. Remrque 5.32. Compte-tenu de l remrque 5.28-4, on générlise fcilement l proposition 5.3 et le corollire 5.31 u cs où les «blocs» ne sont plus forcément indexés pr des entiers consécutifs, pourvu que les blocs d indices correspondnts restent deux à deux disjoints. Ainsi pr exemple si X 1,..., X 7 sont indépendntes, (X 3, X 1 ), (X 2, X 5, X 7 ) et (X 6, X 4 ) sont des vecteurs létoires indépendnts. L démonstrtion détillée de l proposition 5.3 sortirit du progrmme de ce cours où sont seulement exigibles l énoncé et son utilistion prtique. Ce qui suit s dresse ux lecteurs plus vncés ou désireux d en svoir plus. Le lecteur débutnt peut suter ce pssge et ller directement à l définition 5.34. L preuve informelle 6 de l proposition 5.3 que nous décrivons mintennt distingue deux idées dns cette proposition. L première est l hérédité pour les blocs, i.e. le corollire 5.31 et utilise l construction de «probbilités produits». L deuxième est l hérédité pour les imges des blocs pr les trnsformtions boréliennes h j et repose sur l notion d indépendnce de sous-tribus de F. Preuve informelle de l hérédité pour les blocs. Prtons donc de l églité (5.11) qui exprime notre hypothèse d indépendnce des X i. Avec les nottions pour les blocs introduites dns l énoncé de l proposition 5.3, identifions R n vec R m 1 R m k. Pour j = 1,..., k, notons C j l fmille des produits crtésiens B j = B nj 1 +1 B nj de m j boréliens quelconques de R. En rppelnt que Y j := (X nj 1 +1,..., X nj ), ceci nous permet de réécrire (5.11) sous l forme suivnte vérifiée pour tous choix des B j C j. P (Y 1 B 1,..., Y k B k) = k j=1 n j 1 <i n j P (X i B i ). (5.13) En prticulier si on choisit ci-dessus pour un j fixé, B i = R pour tous les i hors de ]n j 1, n j ], chque B l pour l j est égl à R m l et on obtient près effcement des 6. Nous ne prétendons ps donner une preuve complète, mis plutôt pointer les difficultés et indiquer l outillge mthémtique utilisé pour les surmonter. Ch. Suquet, Cours I.P.É. 21 175
Chpitre 5. Vecteurs létoires et indépendnce conditions inutiles du type Y l R m l ou X i R, B j C j, P (Y j B j) = n j 1 <i n j P (X i B i ). (5.14) Ceci étnt vri pour j quelconque, on obtient en reportnt dns (5.13) : B 1 C 1,..., B k C k, P (Y 1 B 1,..., Y k B k) = k P (Y j B j). (5.15) Pour en déduire que l suite finie de vecteurs létoires Y 1,..., Y k est indépendnte u sens de l définition 5.29, il fudrit pouvoir étendre (5.15) à tous les B j Bor(R m j ), ce qui est loin d être trivil. Notons que si m j 2, C j n est ps une tribu et est strictement incluse dns Bor(R m j ). Pr exemple le disque unité ouvert de R 2 est un borélien de R 2 puisque c est un ouvert et il est impossible de l écrire comme produit crtésien de deux sous-ensembles de R (exercice!). Notons µ := P Y1,...,Y k, l loi du vecteur létoire hétéroclite (Y 1,..., Y k ) de R m 1 R m k, définie vi l indentifiction de cet espce vec R n pr : D Bor(R n ), µ(d) = P ( (Y 1,..., Y k ) D ). Définissons l tribu produit Bor(R m 1 ) Bor(R m k ) comme l tribu sur R m 1 R m k engendrée pr l fmille des produits crtésiens D 1 D k, où chque D j est un borélien quelconque de R m j. On peut montrer que cette tribu coïncide vec l tribu borélienne de R m 1 R m k, donc de R n. On montre ussi que l on peut définir sur cette tribu produit l probbilité produit ν = P Y1 P Yk comme l unique mesure vérifint D 1 Bor(R m 1 ),..., D k Bor(R m k ), ν(d 1 D k ) = P Y1 (D 1 )... P Yk (D k ). Notons enfin C l fmille des sous-ensembles de R m 1 R m k de l forme B 1 B k, où B j C j, j = 1,..., k. Muni de tout cet ttiril, on peut réécrire (5.15) sous l forme : j=1 C C, µ(c) = ν(c). Finlement, on vérifie que C est une fmille stble pr intersections finies, qui engendre l tribu borélienne de R m 1 R m k. Comme les mesures de probbilité µ et ν coïncident sur C, elles coïncident sur l tribu engendrée 7, i.e. µ(d) = ν(d) pour tout D Bor(R m 1 R m k ). Comme cette tribu contient tous les produits crtésiens D 1 D k de boréliens quelconques des R m j, on en déduit l extension de (5.15) vec les D j u lieu des B j, obtennt insi l indépendnce de l suite de vecteurs létoires Y 1,..., Y k. 7. Pr le théorème d unicité des mesures, ppliqué dns le cs de mesures finies, cf. Cours IFP 23 4, Chpitre 1, th. 1.34, disponible à l URL http://mth.univ-lille1.fr/~suquet/ 176 Ch. Suquet, Cours I.P.É. 21
5.2. Indépendnce de vribles et vecteurs létoires Preuve informelle de l hérédité pr trnsformtions boréliennes. Soient Ω et Ω deux ensembles quelconques, F une tribu sur Ω et f : Ω Ω quelconque. Notons f 1 (F ) l fmille {f 1 (B); B F }, en rppelnt que si B Ω, f 1 (B) = {ω Ω; f(ω) B}. Il est fcile de voir que f 1 (F ) est une tribu sur Ω. Cel résulte du fit que l réunion et le pssge u complémentire commutent vec l inverse ensembliste (cf. proposition 3.3) et que F est une tribu sur Ω. Cette tribu f 1 (F ) est ppelée tribu engendrée pr f (reltivement à F ) et notée ussi σ(f). Si Ω est muni lui-même d une tribu F, l condition f 1 (F ) F équivut tout simplement à l mesurbilité de f pour les tribus F F. En prticulier si X est une ppliction Ω R d, dire que X est un vecteur létoire sur (Ω, F) s écrit X 1 (Bor(R d )) F. Arrivés là, il nous fut donner une définition qui jette un nouvel éclirge sur l indépendnce des vribles ou vecteurs létoires. Définition 5.33 (indépendnce de n sous-tribus de F). Soient (Ω, F, P ) un espce probbilisé et F 1,..., F n des sous-tribus 8 de F. On dit qu elles sont indépendntes si A 1 F 1,..., A n F n, P ( n i=1 A i ) = n P (A i ). (5.16) Grâce à cette définition, on peut voir que l indépendnce des vribles létoires X 1,..., X n est exctement l indépendnce des tribus engendrées 9 σ(x 1 ),..., σ(x n ). On peut réécrire de l même fçon l indépendnce des vecteurs létoires vue à l défini- ( tion 5.29, l seule dpttion étnt que σ(x i ) = X 1 i Bor(R d i ) ) ( ) u lieu de X 1 i Bor(R). Il est clir d près l définition 5.33 que si les tribus F 1,..., F n sont des sous-tribus de F indépendntes et si pour chque i, G i est une sous-tribu de F i, lors G 1,..., G n sont ussi des sous-tribus indépendntes de F. En d utres termes, l indépendnce des tribus est héritée pr leurs sous-tribus. Disposnt mintennt de tous les ingrédients, nous pouvons prouver l proposition 5.3 comme suit. D bord l indépendnce de l suite X 1,..., X n psse à celle des vecteurs blocs Y j = (X nj 1 +1,..., X nj ), j = 1,..., k, comme nous l vons étbli ci-dessus. Cette indépendnce des Y j équivut à celle des sous-tribus F j := σ(y j ) de F. Notre but est d étblir l indépendnce des vecteurs imges Z j = h j (Y j ), qui équivut à l indépendnce des tribus G j := σ(z j ). Celle-ci découle pr héritge de l indépendnce des tribus σ(y j ), j = 1,..., k en rison des inclusions σ(z j ) σ(y j ) que l on peut justifier comme suit : i=1 σ(z j ) = { Z 1 j (B); B Bor(R d j ) } = { (h j Y j ) 1 (B); B Bor(R d j ) } = { Y 1 j ( h 1 j (B) ) ; B Bor(R d j ) } et h j : R m j R d j étnt borélienne, h 1 j (B) Bor(R m j ) pour tout B Bor(R d j ), d où σ(z j ) { Y 1 j (C); C Bor(R m j ) } = σ(y j ). 8. Une sous-tribu de F est une sous-fmille de F qui possède encore l structure de tribu. 9. Qui sont bien des sous-tribus de F, à cuse de l mesurbilité des X i. Ch. Suquet, Cours I.P.É. 21 177
Chpitre 5. Vecteurs létoires et indépendnce Définition 5.34 (indépendnce d une suite infinie de v..). Soit (X i ) i N, une suite de vribles létoires définies sur le même espce probbilisé (Ω, F, P ). On dit qu elles sont indépendntes si toute sous-suite finie est indépendnte u sens de l définition 5.27 i.e. pour tout ensemble fini K N, et toute fmille (B i ) i K de boréliens de R, ( ) P {X i B i } i K = i K P (X i B i ). (5.17) Cette définition se générlise u prix d lourdissements d écriture à une suite de vecteurs létoires. 5.2.2 Indépendnce des composntes Nous exminons mintennt l crctéristion de l indépendnce des composntes d un vecteur létoire, en nous restreignnt ux deux cs prticuliers importnts des vecteurs létoires discrets ou à densité. Proposition 5.35 (vecteur létoire discret à composntes indépendntes). Soit X = (X 1,..., X d ) un vecteur létoire discret. Ses composntes X i sont indépendntes si et seulement si (x 1,..., x d ) X(Ω), P (X 1 = x 1,..., X d = x d ) = P (X 1 = x 1 )... P (X d = x d ). (5.18) Preuve. L indépendnce des X i implique clirement (5.18) en prennt B i = {x i }, pour i = 1,..., d dns l définition 5.27. Pour l réciproque, on suppose que le vecteur létoire discret X vérifie (5.18) et il s git de montrer que P X (B) = P X1 (B 1 )... P Xd (B d ), pour tout B := B 1 B d où les B i sont des boréliens quelconques de R. Comme X est discret, chque X i (Ω) est u plus dénombrble (cf. le commentire près l définition 5.8) donc E := X 1 (Ω) X d (Ω) est u plus dénombrble. De plus E contient X(Ω) et si x E \ X(Ω), P (X = x) =. Ces remrques nous permettent de démrrer le clcul de P X (B) insi : ( P X (B) = x X(Ω) P (X = x)δ x ) (B) = x X(Ω) P (X = x)δ x (B) = x C P (X = x), en notnt C = E B = C 1 C d, où C i := ( X i (Ω) B i ) (vérifiez!). En utilisnt 178 Ch. Suquet, Cours I.P.É. 21
5.2. Indépendnce de vribles et vecteurs létoires l hypothèse (5.18) et le produit de d «séries» à termes positifs 1 : P (X1,...,X d )(B) = = (x 1,...,x d ) C (x 1,...,x d ) C ( P (X1,...,X d ) {(x1,..., x d )} ) P (X 1 = x 1,..., X d = x d ) = P (X 1 = x 1 )... P (X d = x d ) (5.19) (x 1,...,x d ) C 1 C d ( ) ( ) = P (X 1 = x 1 ) P (X d = x d ) (5.2) x 1 C 1 x d C d = P (X 1 B 1 )... P (X d B d ). Les boréliens B i étnt quelconques, ceci étblit l indépendnce des vribles létoires X 1,..., X d. Pssons u cs d un vecteur létoire à densité, pour lequel il est commode d introduire l nottion suivnte. Si f 1,..., f d sont des pplictions R R, on définit l ppliction «produit tensoriel» des f i pr f 1 f d : R d R, (x 1,..., x d ) f 1 (x 1 )... f d (x d ). (5.21) On prendr bien grde de ne ps confondre ce produit tensoriel vec le produit ordinire. Pr exemple si f est l identité sur R, f f est l ppliction (s, t) st, tndis que ff = f 2 : R R, s s 2. Proposition 5.36 (vecteur à densité et indépendnce des composntes). Soit X = (X 1,..., X d ) un vecteur létoire de R d. ) Si les composntes de X sont indépendntes et si chque X i (i = 1,..., d) une densité f Xi, lors X dmet pour densité l fonction f X1 f Xd. b) Si X dmet une densité de l forme f = f 1 f d, où les f i sont des fonctions R \ K i R + (les K i étnt finis éventuellement vides), lors les v.. réelles X i sont indépendntes et chque X i dmet une densité f Xi = c i f i vec des constntes c i ], + [ dont le produit c 1... c d vut 1. Preuve du ). Clculons P X (C) pour C := [ 1, b 1 ] [ d, b d ] pvé fermé borné quelconque de R d. On commence pr écrire l évènement {X C} comme une intersection d évènements en notnt que {X C} = { (X 1,..., X d ) [ 1, b 1 ] [ d, b d ] } = { i = 1,..., d, X i [ i, b i ] }, 1. Certines d entre elles peuvent n être que des sommes finies. L formule utilisée pour psser de (5.19) à (5.2) repose sur le théorème de sommtion pr pquets des fmilles à termes positifs et s vérifiction est essentiellement l même que pour le produit de deux séries. Ch. Suquet, Cours I.P.É. 21 179
Chpitre 5. Vecteurs létoires et indépendnce d où, les X i étnt indépendntes et à densité, ( d ) P (X C) = P {X i [ i, b i ]} = i=1 d P ( X i [ i, b i ] ) = i=1 d i=1 bi i f Xi (t i ) dt i. Pr un corollire clssique du théorème de Fubini-Tonnelli, ce produit d intégrles de fonctions positives peut s écrire comme une intégrle multiple : d i=1 bi f Xi (t i ) dt i = i Finlement, nous obtenons insi P (X C) = C [ 1,b 1 ] [ d,b d ] f X1 (t 1 )... f Xd (t d ) dt 1... dt d. f X1 f Xd (t 1,..., t d ) dt 1... dt d et cette formule est vrie pour tout pvé fermé borné C. Pour en déduire en vertu de l définition 5.1 que le vecteur létoire X dmet bien pour densité f := f X1 f Xd, il nous reste seulement à vérifier que f insi construite est bien une densité de probbilité sur R d. D bord chque f Xi est définie et positive suf peut-être en un nombre fini de points. Chcun de ces points de non-définition génère pour f un ensemble de non définition qui est un hyperpln de R d. Donc f est définie suf peut-être sur une réunion finie H d hyperplns de R d et positive sur son ensemble de définition. Ensuite f est loclement Riemnn intégrble cr intégrble sur chque pvé fermé borné inclus dns R d \ H et on peut prendre comme suite de compcts K n épuisnt R d \ H une suite croissnte de réunions finies de pvés fermés bornés (un pvé dns chque composnte connexe de R d \ H). Pour vérifier l convergence de l intégrle générlisée sur R d de f, on prend 2d suites i,n et b i,n +, de fçon à former une suite C n = [ 1,n, b 1,n ] [ d,n, b d,n ] croissnte pour l inclusion et de réunion R d. Pr continuité séquentielle croissnte de l probbilité P X, on obtient 1 = P X (R d ) = lim n + P X(C n ) = lim n + [ 1,n,b 1,n ] [ d,n,b d,n ] f(t 1,..., t d ) dt 1... dt d. On en déduit que l intégrle générlisée R d f(t 1,..., t d ) dt 1... dt d converge et vut 1. L fonction f est donc bien une densité de probbilité sur R d et ceci chève l preuve du ). Preuve du b). Puisque X dmet pour densité f = f 1 f d, on sit (proposition 5.14) que ses lois mrginles sont toutes à densité et qu une densité de X i s obtient en intégrnt f pr rpport à toutes les vribles d indice différent de i. Ceci nous donne : f Xi (x i ) = f 1 (t 1 )... f i 1 (t i 1 )f i (x i )f i+1 (t i+1 )... f d (t d ) dt 1... dt i 1 dt i+1... dt d. R i 1 R d i Dns cette intégrtion vec x i fixé et reltivement ux vribles muettes t j, j i, f i (x i ) est une constnte que l on peut sortir de l intégrle multiple. On obtient insi l reltion 18 Ch. Suquet, Cours I.P.É. 21
5.2. Indépendnce de vribles et vecteurs létoires f Xi (x i ) = c i f i (x i ), où c i désigne l intégrle multiple reltive ux t j (j i) et ne dépend ps de x i. Ce clcul étnt vlble pour tout réel x i, on bien f Xi = c i f i, vec une constnte c i dns R + (pour l instnt). En fit c i, cr sinon f Xi serit identiquement nulle sur son ensemble de définition (à l exception peut-être d un ensemble de mesure de Lebesgue nulle), ce qui l empêcherit d être une densité cr cel impliquerit l nullité de + f X i (t) dt. D près l remrque 5.28-3, pour étblir l indépendnce des X 1,..., X d, il suffit de tester l églité (5.11) pour des boréliens B i de l forme [ i, b i ]. Notons C := [ 1, b 1 ] [ d, b d ]. Compte-tenu de l forme prticulière de f, on ici en ppliqunt à nouveu le corollire du théorème de Fubini-Tonnelli pour les produits f 1 f d, P (X C) = C f 1 (t 1 )... f d (t d ) dt 1... dt d = D utre prt, en utilisnt les reltions f Xi = c i f i, on obtient : d i=1 bi i f i (t i ) dt i. (5.22) d P (X i [ i, b i ]) = i=1 d i=1 bi i c i f i (t i ) dt i = (c 1... c d ) d i=1 bi i f i (t i ) dt i. (5.23) Pr comprison de (5.22) et (5.23), on voit lors que pour tout pvé fermé borné C = [ 1, b 1 ] [ d, b d ], d P (X i [ i, b i ]) = (c 1... c d )P (X C). (5.24) i=1 En prennt une suite C n = [ 1,n, b 1,n ] [ d,n, b d,n ] croissnte pour l inclusion et de réunion R d, on en déduit pr continuité séquentielle croissnte de P X et des P Xi que d où d P (X i R) = (c 1... c d )P (X R d ), i=1 c 1... c d = 1. (5.25) En réinjectnt cette vleur dns (5.24), on conclut à l indépendnce des X i. Notons en pssnt que (5.25) interdit que l un des c i ville + (on déjà vu qu ucun ne peut être nul). Exemple 5.37. Supposons que les vribles létoires réelles X 1,..., X d soient indépendntes et que pour i = 1,..., d, X i soit gussienne de loi N(, σ i ), vec σ i >. L proposition 5.36 ) nous dit lors que le vecteur X = (X 1,..., X d ) dmet pour densité : f(t 1,..., t d ) = ( 1 1 exp t2 1 (2π) d/2 σ 1... σ d 2σ1 2 ) t2 d. (5.26) 2σd 2 Ch. Suquet, Cours I.P.É. 21 181
Chpitre 5. Vecteurs létoires et indépendnce Le vecteur X suit une loi gussienne sur R d. Il s git ici d un cs prticulier de vecteur gussien. Il existe des lois gussiennes sur R d pour lesquelles les composntes ne sont ps indépendntes. Pr illeurs, il existe des lois gussiennes sur R d n ynt ps de densité 11. Remrque 5.38. L exemple 5.37 ne contredit ps l remrque 5.6 qui ffirme que l seule connissnce des lois mrginles ne suffit ps à reconstruire l loi du vecteur. En effet ici outre l connissnce des lois mrginles, on dispose d une informtion supplémentire essentielle, l indépendnce des composntes. C est d illeurs un exemple d un principe tout à fit générl illustré pr les propositions 5.35 et 5.36 : si on connît les lois mrginles et si on sit que les composntes sont indépendntes, lors on peut reconstruire l loi du vecteur létoire 12. Exemple 5.39. Soit X = (X 1, X 2 ) un vecteur létoire de densité f donnée pr f(s, t) := 1 (2π 3 ) 1/2 1 (1 + s 2 )(te t ) 1/2 1 ],+ [(t), vec l convention hbituelle pour l usge des indictrices dns les formules explicites (cf. remrque 3.21). L densité est bien le produit d une fonction de l seule vrible s pr une fonction de l seule vrible t. On peut prendre pr exemple f 1 (s) := (1 + s 2 ) 1 et f 2 (t) := (2π 3 ) 1/2 (te t ) 1/2 1 ],+ [ (t). On en déduit pr l proposition 5.36 b) que les v.. X 1 et X 2 sont indépendntes et à densité. On sit de plus qu lors X i dmet une densité f Xi = c i f i (i = 1, 2). On détermine c 1 en écrivnt : 1 = + f X1 (s) ds = + c 1 1 + s 2 ds = c 1π. Donc c 1 = 1/π et comme c 1 c 2 = 1, c 2 = π. Les densités mrginles sont donc finlement : f X1 : s 1 π(1 + s 2 ), f X 2 : t 1 e t/2 1 ],+ [ (t). 2πt On voit que X 1 suit l loi de Cuchy stndrd Cu(, 1). Qunt à l loi de X 2, c est une loi χ 2 (1), i.e. l loi de Z 2 où Z est gussienne N(, 1). On vous lisse le soin de vérifier cette dernière ffirmtion en clculnt l loi de Z 2. Ceci vous permettr de vérifier posteriori que f étit bien une densité de probbilité sur R 2 grâce à l proposition 5.36 ). De même que l seule connissnce des lois des v.. X et Y ne suffit ps en générl pour déterminer l loi du vecteur létoire (X, Y ), elle ne suffit ps non plus pour connître l loi de l v.. X + Y. Voici un exemple presque trivil pour s en convincre. On prend d bord X de loi Bern(1/2), donc P (X = ) = P (X = 1) = 1/2 et Y := 1 X. Alors Y suit ussi l loi Bern(1/2) cr P (Y = ) = P (X = 1) = 1/2 et P (Y = 1) = 11. Dns ce cs, il existe un sous-espce ffine de R d, strictement inclus dns R d et de probbilité 1 pour cette loi gussienne. 12. Pour les lecteurs n ynt ps suté l démonstrtion informelle de l hérédité de l indépendnce, signlons que les composntes de X sont indépendntes si et seulement si P X = P X1 P Xd, probbilité produit des lois mrginles. 182 Ch. Suquet, Cours I.P.É. 21
5.2. Indépendnce de vribles et vecteurs létoires P (X = ) = 1/2. L somme X + Y est l vrible constnte 1, s loi est donc l msse de Dirc δ 1. Prenons mintennt Y := X, lors Y suit encore l loi Bern(1/2) et X + Y = 2X pour loi 1 2 δ + 1 2 δ 2. Supposons mintennt que les vribles létoires réelles X et Y sont indépendntes. Comme X + Y = s(x, Y ), où s est l fonction borélienne s : R 2 R, (x, y) x + y, on devrit pouvoir déterminer l loi de X + Y, à prtir des lois de X et de Y puisque l indépendnce permet de reconstruire l loi de (X, Y ) à prtir de ses lois mrginles. Nous llons triter ce problème dns les deux cs prticuliers où X et Y sont toutes deux discrètes ou toutes deux à densité. On pourr voir en exercice un utre cs prticulier, X discrète et Y à densité. Proposition 5.4 (loi de l somme de deux v.. discrètes). Si X et Y sont deux v.. discrètes définies sur le même espce probbilisé (Ω, F, P ), l loi de l v.. discrète Z := X + Y est donnée pr : z Z(Ω), P (Z = z) = P (X = x, Y = z x) (5.27) x X(Ω) = y Y (Ω) P (X = z y, Y = y). (5.28) Si de plus X et Y sont indépendntes, P Z peut se clculer explicitement à prtir des lois P X et P Y pr les formules : z Z(Ω), P (Z = z) = P (X = x)p (Y = z x) (5.29) x X(Ω) = y Y (Ω) P (X = z y)p (Y = y). (5.3) Preuve. Vérifions d bord que Z est discrète, c est-à-dire que Z(Ω) est u plus dénombrble. Pour cel, on note que l ensemble A := {( X(ω), Y (ω) ) ; ω Ω } est u plus dénombrble prce qu inclus dns X(Ω) Y (Ω), produit crtésien de deux ensembles u plus dénombrbles. L ppliction s : A Z(Ω), (x, y) x + y est surjective, donc Z(Ω) est u plus dénombrble, cf. proposition 1.41. Nous reviendrons ci-dessous (remrque 5.41) sur l description de Z(Ω) que nous n vons ps besoin d expliciter dvntge à ce stde. Justifions (5.27). On commence pr découper Ω suivnt les vleurs de X en union u plus dénombrble d évènements deux à deux disjoints : Ω = {X = x}. x X(Ω) On en déduit que pour tout z Z(Ω), ( ) {Z = z} = {X = x} ( ) {Z = z} = {X = x} {Z = z} x X(Ω) x X(Ω) = {X = x, Y = z x}. x X(Ω) Ch. Suquet, Cours I.P.É. 21 183
Chpitre 5. Vecteurs létoires et indépendnce Cette dernière union est u plus dénombrble et les évènements concernés deux à deux disjoints (certins pouvnt être vides). Pr σ-dditivité de P on en déduit (5.27). Cette formule montre qu il est toujours possible de clculer l loi de X + Y si l on connît l loi P (X,Y ) du couple (X, Y ). Si de plus X et Y sont indépendntes, lors P (X = x, Y = z x) = P (X = x)p (Y = z x), d où (5.29). Les formules (5.28) et (5.3) s obtiennent en échngent les rôles joués pr X et Y dns l preuve ci-dessus. Remrque 5.41. Si l on connît seulement l loi de X et celle de Y, on ne peut même ps déterminer Z(Ω). Pour vous en convincre, revoyez le contre exemple vec les lois Bern(1/2) donné ci-dessus où Z(Ω) peut être selon le cs {1} ou {, 2}. D une mnière générle, il est clir que l on toujours Z(Ω) {x + y; x X(Ω), y Y (Ω)}, (5.31) l inclusion pouvnt être stricte. Cette inclusion est une églité dns le cs où X et Y sont indépendntes et vérifient l condition supplémentire suivnte x X(Ω), P (X = x), y Y (Ω), P (Y = y). (5.32) Pour le voir, montrons que si (x, y) est un couple quelconque de X(Ω) Y (Ω), il existe u moins un ω Ω tel que X(ω) = x et Y (ω) = y, donc pour cet ω, Z(ω) = X(ω)+Y (ω) = x + y. En effet pr indépendnce de X et Y et l condition (5.32), P (X = x, Y = y) = P (X = x)p (Y = y), donc l évènement {ω Ω; X(ω) = x, Y (ω) = y} n est ps vide. Exemple 5.42 (somme de deux v.. de Poisson indépendntes). Si X et Y sont indépendntes et suivent l loi de Poisson de prmètre α et β respectivement, Z := X + Y suit l loi de Poisson de prmètre γ = α + β. Vérifiction. Ici X(Ω) = Y (Ω) = N et i N, P (X = i) = e α α i, j N, P (Y = j) = e β β j, i! j! donc (5.32) est vérifiée et Z(Ω) = {k = i + j; i N, j N} = N. Appliquons mintennt (5.29) en notnt que pour i > k, k i / Y (Ω), donc P (Y = k i) = : k N, P (Z = k) = k e α α i e β β k i P (X = i)p (Y = k i) = i! (k i)! i N i= = e (α+β) 1 k! = e (α+β) (α + β) k, k! ce qui montre que Z suit l loi Pois(γ) pour γ = α + β. k i= k! i!(k i)! αi β k i 184 Ch. Suquet, Cours I.P.É. 21
5.2. Indépendnce de vribles et vecteurs létoires Proposition 5.43 (somme de deux v.. à densité indépendntes). Si les vribles létoires réelles indépendntes X et Y dmettent pour densités respectives f et g, leur somme S = X + Y dmet pour densité le produit de convolution f g défini sur R pr (f g)(s) = + f(s t)g(t) dt = + f(t)g(s t) dt. (5.33) Preuve. Notons d bord que les deux intégrles générlisées figurnt dns (5.33) existent toujours comme éléments de R + et que l on psse de l première à l deuxième pr le chngement de vrible t s t (pour s fixé). Clculons Eh(S) pour h continue bornée quelconque à l ide de l loi du couple (X, Y ). On sit pr l proposition 5.36 ) que cette loi P (X,Y ) dmet pour densité l fonction p = f g. En utilisnt l proposition 5.17 ppliquée à l fonction composée (x, y) h(x + y), on obtient : Eh(S) = Eh(X + Y ) = h(x + y)p(x, y) dx dy = h(x + y)f(x)g(y) dx dy. R 2 R 2 En effectunt dns cette dernière intégrle double le chngement de vrible linéire : (s, t) = (x + y, y), d inverse (x, y) = (s t, t), on obtient (noter que le déterminnt du chngement de vrible vut ici 1) : + { + } Eh(S) = h(s)f(s t)g(t) ds dt = h(s) f(s t)g(t) dt ds. R 2 Ainsi pour toute h : R R continue bornée sur R, on Eh(S) = + h(s)(f g)(s) ds. (5.34) Si on prend en prticulier h = 1 constnte sur R, (5.34) nous donne 1 = + (f g)(s) ds, ce qui nous montre 13 que f g est une densité de probbilité sur R. Soit Z une vrible létoire de densité f g. Alors pr l proposition 4.42, Eh(Z) = + h(s)(f g)(s) ds = Eh(S) pour toute h continue bornée sur R. Pr l proposition 5.16 ppliquée en dimension 1, on en déduit que S et Z ont même loi, donc que S dmet pour densité f g. Exemple 5.44 (somme de deux v.. exponentielles indépendntes). Soient X et Y deux vribles létoires indépendntes suivnt des lois exponentielles de prmètres respectifs 13. En toute rigueur, il fudrit ussi vérifier que f g est bien Riemnn intégrble sur tout intervlle fermé borné de son ensemble de définition (i.e. de l ensemble des s tels que (f g)(s) < + ). Ch. Suquet, Cours I.P.É. 21 185
Chpitre 5. Vecteurs létoires et indépendnce et b. Clculons l densité h = f g de l loi de X + Y, vec ici f(t) = e t 1 R+ (t) et g(t) = b e bt 1 R+ (t). h(s) = + + e (s t) b e bt 1 R+ (s t)1 R+ (t) dt = b e s e ( b)t 1 R+ (s t)1 R+ (t) dt. On peut réécrire le produit d indictrices comme suit : { { 1 si t et s t 1 [,s] (t) si s 1 R+ (s t)1 R+ (t) = = sinon sinon En reportnt ceci dns l intégrle ci-dessus, il vient h(s) = b e s 1 R+ (s) + e ( b)t 1 [,s] (t) dt = b e s 1 R+ (s) s = 1 R+ (s)1 [,s] (t). e ( b)t dt. Cette dernière intégrle est une intégrle de Riemnn ordinire qui se clcule pr primitivtion en distingunt les cs b et = b. Si b, on obtient insi [ e h(s) = b e s ( b)t 1 R+ (s) b ] s = b e s ( e ( b)s 1 ) 1 R+ (s) = b ( e bs e s) 1 R+ (s). b b À titre de précution, on peut vérifier que cette densité h est bien positive en notnt que pour s, ( e bs e s) /(b ) est le tux d ccroissement entre et b de l fonction décroissnte u e su, donc que ce quotient est négtif. Si = b, on obtient h(s) = 2 e s 1 R+ (s) s dt = 2 s e s 1 R+ (s). 5.2.3 Indépendnce et espérnce de produits Une propriété essentielle de l indépendnce des suites de vribles létoires est que l espérnce d un produit est égle u produit des espérnces. L formultion précise, d une portée encore plus générle, est l suivnte. Théorème 5.45. Pour i = 1,..., n, soient X i : Ω R d i des vecteurs létoires indépendnts et h i : R d i R, des fonctions boréliennes telles que les vribles létoires réelles h i (X i ) soient intégrbles. Alors l v.. h 1 (X 1 )... h n (X n ) est intégrble et E ( h 1 (X 1 )... h n (X n ) ) = n Eh i (X i ). (5.35) i=1 En prticulier si pour tout i, d i = 1 et h i est l identité sur R, on obtient l interversion espérnce produit. 186 Ch. Suquet, Cours I.P.É. 21
5.2. Indépendnce de vribles et vecteurs létoires Corollire 5.46. Si X 1,..., X n sont des vribles létoires réelles indépendntes et intégrbles, leur produit X 1... X n est intégrble et E(X 1... X n ) = (EX 1 )... (EX n ). (5.36) Preuve. Pr hérédité de l indépendnce, plus précisément pr l version de l proposition 5.3 où l suite de déprt X 1,..., X n est une fmille hétéroclite de vecteurs létoires indépendnts, le problème se réduit à l preuve de l intégrbilité de Y = Y 1... Y n et de l églité E(Y 1... Y n ) = (EY 1 )... (EY n ), (5.37) pour toute suite finie Y 1,..., Y n (n 2) de v.. intégrbles et indépendntes. Bien qu il soit possible de triter le cs n quelconque d un coup, nous llons réduire le problème u cs n = 2, pour lléger les nottions. Admettons donc pour un instnt que nous yons étbli (5.37) dns le cs n = 2. On fit lors une récurrence finie sur 2 k < n en prennt pour hypothèse que (5.37) est vérifiée pour les produits de k fcteurs. Alors l indépendnce des Y i (1 i n) implique celle de (Y 1,..., Y k ) et de Y k+1, pr hérédité pour les blocs disjoints cf. corollire 5.31 et remrque 5.28-1. Pr l hypothèse de récurrence, Y 1... Y k est intégrble et comme Y k+1 l est ussi, leur produit l est encore pr le cs n = 2. On donc E ( Y 1... Y k Y k+1 ) = E ( (Y1... Y k )Y k+1 ) = ( E(Y 1... Y k ) )( EY k+1 ) pr le cs n = 2 = (EY 1 )... (EY k )(EY k+1 ) pr l hypothèse de récurrence. Ainsi l vlidité de (5.37) u rng k implique s vlidité u rng k + 1, ce qui chève l prtie «hérédité» de notre récurrence finie. Il nous reste mintennt à prouver que pour toutes v.. réelles Y 1 et Y 2 indépendntes et intégrbles, Y 1 Y 2 est intégrble et E(Y 1 Y 2 ) = (EY 1 )(EY 2 ). (5.38) Nous llons triter successivement les cs suivnts. 1. Y i = 1 Ai, i = 1, 2 où les A i F sont des évènements ; 2. Y 1 et Y 2 vribles létoires simples ; 3. Y 1 et Y 2 vribles létoires positives ; 4. Y 1 et Y 2 vribles létoires réelles intégrbles. Cs 1. Si Y i = 1 Ai, pour un A i F, les v.. Y i et leur produit sont intégrbles cr bornées. L indépendnce des v.. Y 1 et Y 2 implique 14 celle des évènements A 1 et A 2 cr A i = { 1 Ai {1} }. D utre prt, on vérifie fcilement (fites-le) que 14. En fit équivut à...(exercice). 1 A1 1 A2 = 1 A1 A 2. Ch. Suquet, Cours I.P.É. 21 187
Chpitre 5. Vecteurs létoires et indépendnce Grâce à l formule E(1 A ) = P (A) et à l indépendnce de A 1 et A 2, on en déduit E(Y 1 Y 2 ) = E ( 1 A1 A 2 ) = P (A1 A 2 ) = P (A 1 )P (A 2 ) = E ( 1 A1 ) E ( 1A2 ) = (EY1 )(EY 2 ), ce qui chève l vérifiction de (5.38) dns le cs des vribles létoires indictrices. Cs 2. Supposons mintennt que Y 1 et Y 2 sont deux vribles létoires simples indépendntes. Elles sont lors bornées donc intégrbles insi que leur produit. Notons Y 1 (Ω) = {y 1,1,..., y 1,l }, les y 1,j étnt tous distincts et fisons de même pour Y 2 (Ω) = {y 2,1,..., y 2,m }. Alors on les décompositions Y 1 = l y 1,j 1 A1,j, Y 2 = j=1 m y 2,k 1 A2,k, k=1 vec A 1,j = {Y 1 = y 1,j } = {Y 1 {y 1,j }} et A 2,k = {Y 2 = y 2,k } = {Y 2 {y 2,k }}. On en déduit que pour 1 j l et 1 k m, les deux évènements A 1,j et A 2,k héritent de l indépendnce de Y 1 et Y 2. En utilisnt l linérité de l espérnce, cette indépendnce d évènements et le cs 1, on obtient : ( l E(Y 1 Y 2 ) = E j=1 k=1 m ) y 1,j y 2,k 1 A1,j 1 A2,k = = = l j=1 k=1 l j=1 k=1 m y 1,j y 2,k E ( ) 1 A1,j 1 A2,k m y 1,j y 2,k E ( ) ( ) 1 A1,j E 1A2,k ( l y 1,j E ( ) )( m 1 A1,j y 2,k E ( ) ) 1 A2,k j=1 k=1 ( l ( m ) = E y 1,j 1 A1,j )E y 2,k 1 A2,k j=1 = EY 1 EY 2. Ainsi (5.38) est vérifiée dns le cs des vribles létoires simples. Cs 3. Soient Y 1 et Y 2 deux vribles létoires positives indépendntes (on n ps besoin de les supposer intégrbles ici). On sit (cf. théorème 4.21) que l v.. positive Y i est limite d une suite croissnte de v.. positives simples : Y i,n Y i, i = 1, 2. Plus précisément, on peut prendre (revoyez l preuve du théorème 4.21 et vérifiez l formule proposée ci-près) k=1 Y i,n = h n (Y i ), h n : R + R +, x min ( n, 2 n [2 n x] ). L fonction h n est croissnte donc borélienne. L proposition 5.3 nous dit lors que pour chque n, les v.. Y 1,n et Y 2,n héritent de l indépendnce de Y 1 et Y 2. Comme ce sont des v.. simples, le cs 2 nous donne : n N, E ( Y 1,n Y 2,n ) = ( EY1,n )( EY2,n ). (5.39) 188 Ch. Suquet, Cours I.P.É. 21
5.2. Indépendnce de vribles et vecteurs létoires En notnt que Y 1,n Y 2,n converge en croissnt vers Y 1 Y 2, un pssge à l limite dns (5.39) et une triple ppliction du théorème de Beppo Levi nous donnent E(Y 1 Y 2 ) = EY 1 EY 2. Cs 4. Si Y 1 et Y 2 sont deux vribles létoires réelles indépendntes et intégrbles, Y 1 et Y 2 sont des v.. positives indépendntes et pr le cs 3, E Y 1 Y 2 = E( Y 1 Y 2 ) = (E Y 1 )(E Y 2 ) < +, ce qui étblit l intégrbilité de Y 1 Y 2. Cette intégrbilité implique ussi celle des produits de v.. positives Y 1 + Y 2 +, Y 1 + Y2, Y1 Y 2 + et Y1 Y2. D utre prt les fcteurs de chcun de ces produits héritent leur indépendnce de celle de Y 1 et Y 2, puisque Y + i = mx(y i, ) et Y i = mx( Y i, ). En utilisnt le cs 3 on obtient lors (notez que toutes les espérnces intervennt dns ce clcul sont finies) : E(Y 1 Y 2 ) = E ( (Y 1 + Y1 )(Y 2 + Y2 ) ) = E(Y 1 + Y 2 + ) E(Y 1 + Y2 ) E(Y1 Y 2 + ) + E(Y1 Y2 ) = EY 1 + EY 2 + EY 1 + EY2 EY1 EY 2 + + EY1 EY2 = ( )( ) EY 1 + EY1 EY + 2 EY2 = (EY 1 )(EY 2 ), ce qui chève l vérifiction de (5.38). L preuve du théorème 5.45 est mintennt complète. Comme sous-produit de l démonstrtion ci-dessus et notmment du cs 3, on le résultt suivnt. Proposition 5.47. Le théorème 5.45 s pplique sns condition d intégrbilité des Y i = h i (X i ) si les fonctions boréliennes h i sont positives. Le corollire 5.46 est vri sns condition d intégrbilité pour des vribles létoires positives. Une ppliction importnte du théorème 5.45 est que l indépendnce de deux v.. implique l nullité de leur covrince (lorsqu elle existe). Proposition 5.48 (indépendnce et covrince). ) Si X et Y sont des v.. réelles de crré intégrble et indépendntes, leur covrince est nulle. b) Si X 1,..., X n sont des v.. réelles de crré intégrble et deux à deux indépendntes, en notnt S n := n k=1 X k, on Vr S n = n Vr X k. (5.4) k=1 Ch. Suquet, Cours I.P.É. 21 189
Chpitre 5. Vecteurs létoires et indépendnce Preuve. Le ) est une conséquence immédite du corollire 5.46 et de l formule de Koenig puisque Cov(X, Y ) = E(XY ) (EX)(EY ) = (EX)(EY ) (EX)(EY ). On peut le voir ussi à prtir de l définition de l covrince puisque X EX et Y EY héritent de l indépendnce de X et Y et sont deux v.. d espérnce nulle. Notons ussi que pour des v.. indépendntes, on n ps besoin de supposer que X et Y soient de crré intégrble pour définir leur covrince, leur intégrbilité suffit. Le b) est une conséquence immédite du ) vi l formule 5.9. Notons qu il suffit d voir ici l indépendnce deux à deux qui est plus fible que l indépendnce mutuelle 15. Remrque 5.49. L nullité de l covrince de deux v.. réelles X et Y n implique ps leur indépendnce. Voici un contre exemple. Prenons X de loi uniforme sur [ 1, +1] et Y := X 2. On lors en notnt que X pour densité 1 2 1 [ 1,1], EX = 1 2 +1 1 x dx = et E(XY ) = E(X 3 ) = 1 2 +1 1 x 3 dx =, d où Cov(X, Y ) = E(XY ) (EX)(EY ) =. Il est clir intuitivement que X et Y ne sont ps indépendntes puisque Y est une fonction déterministe de X. Pour vérifier cette non-indépendnce pr le clcul, on peut remrquer que d une prt P ( X [, 1/2] et Y [, 1/4] ) = P ( X [, 1/2] et X [ 1/2, 1/2] ) et d utre prt = P ( X [, 1/2] ) = 1 4 P ( X [, 1/2])P ( Y [, 1/4] ) = 1 4 P ( X [ 1/2, 1/2] ) = 1 8. 15. En fit il suffit d voir l non-corréltion deux à deux, c est-à-dire Cov(X i, X j ) = pour i j, ce qui est encore plus fible. 19 Ch. Suquet, Cours I.P.É. 21
Chpitre 6 Théorèmes limites Nous commençons dns ce chpitre l étude du comportement symptotique de suites de vribles létoires. Après voir vu les différents modes de convergence de ces suites, nous bordons l loi des grnds nombres. Ce résultt essentiel nous dit que les moyennes rithmétiques d une suite de v.. X i indépendntes et de même loi ynt une espérnce, convergent en un certin sens, vers cette espérnce : M n := S n n = 1 n n i=1 X i n + EX 1. (6.1) Cette convergence est très utile en sttistique pour estimer des prmètres d une loi inconnue, sur l bse de l observtion d un échntillon X 1,..., X n de grnde tille. Le prolongement nturel de ce chpitre est l étude du théorème limite centrl qui donne une sorte de vitesse de convergence pour l loi des grnds nombres, permettnt notmment de construire des «intervlles de confince» pour l estimtion d un prmètre. Ce théorème ser vu u début du cours d Initition à l Sttistique. 6.1 Convergences de suites de v.. 6.1.1 Convergence presque sûre et en probbilité Qund on envisge l question de l convergence d une suite de v.. (Y n ) vers une v.. Y, l première notion de convergence qui vienne à l esprit est l convergence simple sur tout Ω, u sens de l nlyse 1 : ω Ω, Y n (ω) n + Y (ω). On voit imméditement que cette notion n est ps stisfisnte pour l convergence de l suite (M n ) donnée en (6.1). En effet considérons le modèle probbiliste infini le plus simple possible, à svoir le jeu de pile ou fce infini. On peut prendre ici Ω = {f, p} N et ω est une suite infinie ω = (u i ) i 1, vec u i {f, p} pour tout i. En prennt pour X i 1. Ceci suppose que les Y n et Y sont définies sur le même Ω. 191
Chpitre 6. Théorèmes limites l indictrice de l évènement obtention de pile u i e lncer, M n est l fréquence d pprition de pile u cours des n premiers lncers. Si l pièce est équilibrée, on s ttend à ce que M n converge vers 1/2. Or il est clir qu il y une infinité d évènements élémentires ω pour lesquels M n (ω) ne converge ps vers 1/2. On peut même construire fcilement une infinité de ω pour lesquels M n (ω) n ucune limite 2. Ce simple exemple montre que l notion de convergence simple n est ps pertinente en théorie des probbilités. Pour dépsser ce problème, on introduit l notion de convergence presque sûre, i.e. l convergence simple de Y n vers Y sur un sous-ensemble Ω de probbilité 1 de Ω. Définition 6.1 (convergence presque sûre). Soient (Y n ) n 1 et Y des vribles létoires définies sur le même espce probbilisé (Ω, F, P ). On dit que Y n converge presque sûrement vers Y, nottion Y n Y, si P p.s. n + (Ω ) = 1, en notnt Ω := { ω Ω; lim Y n(ω) = Y (ω) }. (6.2) n + Cette définition soulève imméditement une question. Pour que l églité P (Ω ) = 1 it un sens, encore fut-il que Ω pprtienne à l tribu F sur lquelle est définie l fonction d ensembles P. Pour étblir l pprtennce à F de Ω, il est nturel de s ppuyer sur l mesurbilité des Y n et de Y dont héritent les v.. positives Y n Y. Pour cel, on commence pr écrire vec des quntificteurs l pprtennce à Ω : ω Ω ε >, j = j(ω, ε) N, k j, Y k (ω) Y (ω) < ε. (6.3) En utilisnt l trduction utomtique des quntificteurs en opértions ensemblistes, cf. p. 6, on en déduit que Ω = ε> j N { Y k Y < ε}. (6.4) k j En lisnt (6.4) de droite à guche, on obtient les pprtennces successives à F, d bord des ensembles { Y k Y < ε} en rison de l mesurbilité des v.. Y n Y, puis de l intersection dénombrble sur k, puis de l union dénombrble sur j. Arrivés là, on est coincés cr l dernière intersection sur ε pour ensemble d indextion ], + [ qui est infini non-dénombrble. On ne peut donc ps en déduire l pprtennce à F de Ω. Pour frnchir cet obstcle, il suffit de revenir à (6.3) et d écrire une version «discrétisée» de l convergence de Y n (ω) vers Y (ω). Pour cel on choisit une suite de réels strictement positifs (ε i ) i 1, tendnt vers et on écrit que ω Ω i 1, j = j(ω, i) N, k j, Y k (ω) Y (ω) < ε i. (6.5) L trduction utomtique des quntificteurs nous donne mintennt Ω = i N j N { Y k Y < ε i }. (6.6) k j 2. Pour pprofondir cette question, voir l section «6.5 Discussion» dns [ICP]. 192 Ch. Suquet, Cours I.P.É. 21
6.1. Convergences de suites de v.. Sous cette forme, il est mintennt clir que Ω pprtient à F et ceci légitime l définition 6.1. Nous vons étbli u pssge que ( ) p.s. Y n Y P { Y k Y < ε i } = 1, (6.7) n + i N j N k j pour une suite de réels ε i >, tendnt vers. Pour l instnt, (6.7) n est ps directement exploitble comme méthode prtique pour montrer une convergence presque sûre, mis on peut progresser dns cette direction en «fisnt sortir le i» de l probbilité. Cette opértion est légitimée pr le lemme suivnt. Lemme 6.2. Si (B i ) i 1 est une suite d évènements, on l équivlence ( ) P B i = 1 i 1, P (B i ) = 1. (6.8) i 1 Preuve. L impliction est évidente cr pour tout j 1, on i 1 B i B j, d où ( ) 1 = P B i P (B j ) 1. i 1 Pour l réciproque, on montre que si tous les P (B i ) vlent 1, lors P ( ( i 1 B i ) c) =. Ceci s obtient pr sous-σ-dditivité de P : (( ) c ) ( ) + P B i = P i 1 i 1 Bc i P (Bi c ) =, i=1 puisque tous les termes de cette série sont nuls. En ppliqunt le lemme 6.2 ux évènements B i := j N k j { Y k Y < ε i }, nous obtenons à prtir de (6.7) l équivlence entre l convergence presque sûre de Y n vers Y et l condition ( ) i N, P { Y k Y < ε i } = 1, (6.9) j N k j Mintennt que nous vons réussi à fire sortir le «ε» de l probbilité, on peut lisser tomber l discrétistion pour boutir à l crctéristion suivnte de l convergence presque sûre. Proposition 6.3 (une c.n.s. de convergence p.s.). L suite de vribles létoires (Y n ) n 1 converge presque sûrement vers l vrible létoire Y si et seulement si ( ) ε >, P { Y k Y < ε} = 1, (6.1) j N k j ou encore ε >, ( P j N ) { Y k Y ε} =. (6.11) k j Ch. Suquet, Cours I.P.É. 21 193
Chpitre 6. Théorèmes limites Preuve. L équivlence entre (6.1) et (6.11) est évidente pr pssge u complémentire. Vérifions l équivlence entre (6.1) et l c.n.s. (6.9) de convergence presque sûre. Il est clir que (6.1) implique (6.9). Pour l réciproque, il suffit de remrquer que l fonction t P ( j N k j { Y k Y < t} ) est croissnte. En effet si s < t, l inclusion d évènements { Y k Y < s} { Y k Y < t} se propge à l intersection sur k j, puis à l union sur j. Supposons (6.9) vrie et fixons ε > quelconque. Comme l suite (ε i ) i 1 tend vers, on peut trouver un i tel que ε i < ε et lors d où (6.1). ( 1 = P j N { Y k Y < ε i } k j ) ( P j N ) { Y k Y < ε} 1, k j Intéressons nous mintennt à (6.11). En notnt A k := { Y k Y ε}, on imerit trouver une condition qui nous ssure que P ( j N k j A k ) =. En prtique, on souvent une mjortion des probbilités P (A k ) vi une inéglité du type inéglité de Mrkov et il est donc nturel de chercher une condition portnt sur les P (A k ). Ce problème un intérêt propre, indépendnt de l définition des A k, provennt de l interpréttion suivnte de l évènement j N k j A k : j N A k = {ω Ω; ω pprtient à une infinité de A k } k j = {ω Ω; ω rélise une infinité de A k } = {rélistion d une infinité de A k }. L étude de l probbilité de cet évènement conduit ux deux lemmes de Borel Cntelli. Lemme 6.4 (Borel Cntelli I). Soit (A n ) n N une suite d évènements telle que Alors + n= P (A n ) < +. (6.12) P ( rélistion d une infinité de A n ) =. Preuve. Introduisons l nottion 3 A := {rélistion d une infinité de A n } et posons C j := k j A k. L suite (C j ) j N est décroissnte pour l inclusion et d intersection A. Pr continuité séquentielle décroissnte de P, on donc Pr sous-σ-dditivité de P, on d utre prt P (C j ) j + P (A ). (6.13) j N, P (C j ) k j P (A k ) =: r(j). (6.14) 3. Cette écriture est commode, mis non stndrd, donc pensez à en expliciter l définition si vous êtes tenté de l réutiliser dns un exercice. Vous trouverez prfois dns l littérture l nottion lim sup n + A n pour l évènement «rélistion d une infinité de A n». Cette nottion est proscrite de ce cours pr choix pédgogique. 194 Ch. Suquet, Cours I.P.É. 21
6.1. Convergences de suites de v.. Grâce à l hypothèse (6.12), r(j) est le reste d une série convergente, donc tend vers qund j tend vers +. Cette convergence combinée vec l mjortion (6.14) nous donne P (C j ). (6.15) j + L conclusion P (A ) = découle lors de (6.13) et (6.15). Le lemme de Borel Cntelli I est d une portée très générle, puisqu on obtient l conclusion P (A ) = sous l seule hypothèse de convergence de l série n N P (A n), sns rien supposer sur l structure de dépendnce de l suite (A n ). Pour les suites d évènements indépendnts, on le résultt complémentire suivnt. Lemme 6.5 (Borel Cntelli II). Soit (A n ) n N une suite d évènements indépendnts telle que + P (A n ) = +. (6.16) Alors n= P ( rélistion d une infinité de A n ) = 1. Preuve. Notons encore A := {rélistion d une infinité de A n } et posons C j,l := A k, j k l C j := k j A k, d où A = j N C j. Les A c k héritnt de l indépendnce des A k, cf. remrque 2.55, on ( l ) P (C j,l ) = 1 P (Cj,l) c = 1 P A c k = 1 k=j l ( 1 P (Ak ) ). On utilise lors l inéglité de convexité 4 e x 1 x vec x = P (A k ) pour obtenir l minortion 1 P (C j,l ) 1 l k=j k=j exp ( P (A k ) ) ( = 1 exp l k=j ) P (A k ). (6.17) En lissnt j fixe et fisnt tendre l vers l infini dns (6.17), on en déduit grâce à l hypothèse (6.16) que P (C j,l ) tend vers 1. D utre prt C j est limite croissnte pour l inclusion des C j,l, donc pr continuité croissnte séquentielle de P, P (C j ) = lim l + P (C j,l) = 1. 4. L représenttion grphique de l fonction convexe x e x est toujours u-dessus de s tngente à l origine d où e x 1 x pour tout x R. Ch. Suquet, Cours I.P.É. 21 195
Chpitre 6. Théorèmes limites Cette églité étnt vrie pour tout j N, on en déduit pr le lemme 6.2 que ( ) P C j = 1. j N Comme l intersection de tous les C j est l évènement A, le lemme est démontré. Après cette longue, mis utile, digression sur les lemmes de Borel Cntelli, revenons à notre quête d une condition prtique de convergence presque sûre. Le premier lemme de Borel Cntelli nous permet d boutir u résultt suivnt. Proposition 6.6 (condition suffisnte de convergence p.s.). Soient Y et (Y n ) n 1 des vribles létoires réelles définies sur le même espce probbilisé (Ω, F, P ) et vérifint ε >, + n=1 P ( Y n Y ε) < +. (6.18) Alors Y n converge presque sûrement vers Y. On dit d une suite (Y n ) n 1 vérifint (6.18) qu elle converge presque complètement vers Y. Preuve. Fixons ε > quelconque et posons A n := { Y n Y ε}. Pr le premier lemme de Borel-Cntelli, on déduit de (6.18) que l probbilité de rélistion d une infinité de A n est nulle, ce qui s écrit encore ( P j N ) { Y k Y ε} =. k j Ceci étnt vérifié pour tout ε >, l c.n.s. (6.11) de l proposition 6.3 nous donne l convergence presque sûre de Y n vers Y. Nous introduisons mintennt un nouveu mode de convergence de Y n vers Y, l convergence en probbilité. Cette notion nous ser utile pour l loi fible des grnds nombres. Définition 6.7. L suite Y n converge en probbilité vers Y (nottion Y n Pr Y ) si n + ε >, P ( Y n Y ε ) n +. Notons l différence de point de vue pr rpport à l convergence presque sûre. Dns l convergence presque-sûre, on reste proche de l notion de convergence simple de l nlyse. Il s git de l convergence de l suite de réels (Y n (ω)) n 1, pour tous les ω d un même évènement de probbilité 1. L convergence en probbilité ne concerne ps le comportement symptotique individuel de chque suite (Y n (ω)) n 1, mis plutôt celui de l suite d évènements D n,ε := { Y n Y < ε} dont l probbilité P (D n,ε ) doit tendre vers 1, pour tout ε. En prtique, étblir l convergence en probbilité de Y n vers Y est souvent un trvil préliminire pour prouver l convergence presque-sûre de Y n 196 Ch. Suquet, Cours I.P.É. 21
6.1. Convergences de suites de v.. vers Y. En effet si on utilise l condition suffisnte de convergence p.s. (6.18), pour que l série converge, il fut déjà que son terme générl tende vers et cette convergence vers (pour tout ε) est précisément l convergence en probbilité de Y n vers Y. Bien sûr, comme (6.18) n est qu une condition suffisnte, cette remrque ne nous permet ps d ffirmer que l convergence en probbilité est une notion plus fible que l convergence presque-sûre. Ce qui suit v nous montrer qu il en est pourtnt bien insi. Proposition 6.8. L convergence presque-sûre implique l convergence en probbilité. Preuve. Fixons ε >. L hypothèse de convergence presque sûre de Y n vers Y signifie que l événement Ω := {ω Ω; lim Y n(ω) = Y (ω)} n + pour probbilité 1. Définissons Ω ε := {ω Ω; k = k (ω), n k, Y n (ω) Y (ω) < ε}. C est bien un évènement (i.e. Ω ε F) puisqu il s écrit Ω ε = k N { Y n Y < ε}. n k De plus Ω ε contient Ω, donc P (Ω ε) = 1. Pour tout k 1, notons A k := {ω Ω; n k, Y n (ω) Y (ω) < ε} = n k { Y n Y < ε}. L suite (A k ) k 1 est clirement croissnte pour l inclusion et s réunion est Ω ε. Pr continuité séquentielle croissnte de P, on donc P (A k ) P (Ω ε) = 1 (k + ). Pr conséquent, δ >, k 1, P (A k1 ) > 1 δ. Pour tout n k 1, l évènement { Y n Y < ε} contient A k1, d où n k 1, P ( Y n Y < ε) > 1 δ. En pssnt à l évènement complémentire, on obtient finlement δ >, k 1 N, n k 1, P ( Y n Y ε) < δ. Ceci étblit l convergence vers de P ( Y n Y ε). Comme ε étit quelconque, on bien convergence en probbilité de Y n vers Y. Remrque 6.9. L convergence en probbilité n implique ps l convergence presquesûre. Voici un contre exemple. On prend comme espce probbilisé (], 1], Bor(], 1]), λ), où λ est l restriction à ], 1] de l mesure de Lebesgue sur R. On définit sur cet espce les Y n comme suit : Y 1 = 1 ],1], Y 2 = 1 ],1/2], Y 3 = 1 ]1/2,1], Y 4 = 1 ],1/4], Y 5 = 1 ]1/4,1/2], Y 6 = 1 ]1/2,3/4], Y 7 = 1 ]3/4,1], Y 8 = 1 ],1/8], Y 9 = 1 ]1/8,1/4],........................, Y 15 = 1 ]7/8,1], Y 16 = 1 ],1/16],...... Ch. Suquet, Cours I.P.É. 21 197
Chpitre 6. Théorèmes limites Le lecteur qui ne se stisferit ps de cette définition informelle peut toujours s exercer à trouver une formule explicite pour Y n. Sns entrer dns ces détils techniques, on peut fcilement se convincre de deux choses : 1. Pour tout ω ], 1], l suite de «bits» (Y n (ω)) n 1 est formée d une infinité de et d une infinité de 1. Elle ne peut donc converger (s limite inférieure vut et s limite supérieure 1). Ainsi non seulement on n ps de convergence presque sûre de Y n, mis en plus Y n (ω) ne converge pour ucun ω Ω. 2. Pour < ε < 1, P ( Y n > ε) = P (Y n = 1) = λ(i n ), en notnt I n l intervlle dydique dont Y n est l indictrice. L longueur λ(i n ) de cet intervlle tend vers zéro qund n tend vers l infini (à l même vitesse que l inverse du logrithme en bse deux de n). Donc Y n converge vers en probbilité. Remrque 6.1. Il est toutefois possible d obtenir l convergence presque sûre à prtir de l convergence en probbilité, à condition d voir une bonne vitesse de convergence en probbilité. Le sens précis de cette ffirmtion est donné pr l proposition 6.6. L proposition 6.6 permet ussi, même sns bonne vitesse de convergence en probbilité, d obtenir de l convergence p.s. pour une sous-suite. Proposition 6.11 (convergence p.s. d une sous-suite). Si l suite (Y n ) n 1 converge en probbilité vers Y, on peut en extrire une sous-suite (Y ni ) i 1 qui converge presque sûrement vers Y. Preuve. Notons ε i = 2 i. L convergence en probbilité de Y n vers Y implique pour tout i 1, l convergence de P ( Y n Y > ε i ) vers qund n tend vers l infini. On en déduit l existence d une suite strictement croissnte d indices n i telle que Vérifions mintennt que i 1, P ( Y ni Y ε i ) 1 i 2. ε >, + i=1 P ( Y ni Y ε) < +. En effet l convergence vers de ε i nous ssure de l existence d un i = i (ε) tel que pour tout i i, ε i < ε. Pour i i, on donc { Y ni Y ε} { Y ni Y ε i } et cette inclusion d évènements nous permet de mjorer le terme générl de l série ci-dessus pr i 2 à prtir du rng i. Ainsi l suite (Y ni ) converge presque complètement vers Y donc ussi presque sûrement. 6.1.2 Convergence en moyenne d ordre p Nous introduisons mintennt un nouveu mode de convergence, utile notmment dns les problèmes d interversion limite espérnce. 198 Ch. Suquet, Cours I.P.É. 21
6.1. Convergences de suites de v.. Définition 6.12. Soit p 1 un réel et (Y n ) n 1 une suite de v.. ynt un moment bsolu d ordre p fini. On dit que cette suite converge en moyenne d ordre p (ou u sens L p ) vers l v.. Y si lim E( Y n Y p) =. (6.19) n + Nottion : Y n L p n + Y. Remrque 6.13. Si Y n converge vers Y en moyenne d ordre p, Y nécessirement un moment bsolu d ordre p fini. Pour le voir, on utilise l convexité de l fonction ϕ : R + R +, x x p, pour p 1. Ceci signifie que l «corde» entre deux points de son grphe est «u dessus» de l rc de courbe correspondnt, ou encore que «l imge du brycentre» est mjorée pr «le brycentre des imges», voir l figure 6.1. Cette convexité implique notmment que pour tous, b, ϕ ( ) +b 2 1 ϕ() + 1 ϕ(b), ce qui 2 2 s écrit encore, b, ( + b) p 2 p 1 ( p + b p ). (6.2) y b p y = x p 1 2 p + ( 1 2 bp +b ) p 2 p Fig. 6.1 Convexité de x x p et inéglité ( ) +b p 2 1 2 (p + b p ) +b 2 b x Pr croissnce de ϕ, inéglité tringulire et (6.2) ppliquée vec = Y n (ω) et b = Y (ω) Y n (ω), on voit que pour tout ω Ω, Y (ω) p ( Y n (ω) + Y (ω) Y n (ω) ) p 2 p 1 Y n (ω) p + 2 p 1 Y (ω) Y n (ω) p. Pr croissnce de l espérnce, on en déduit : E Y p 2 p 1 E Y n p + 2 p 1 E Y Y n p. Ce mjornt est fini cr E Y n p est fini pr hypothèse et E Y Y n p tend vers donc est fini u moins pour n ssez grnd. Ch. Suquet, Cours I.P.É. 21 199
Chpitre 6. Théorèmes limites Proposition 6.14. L convergence en moyenne d ordre p implique l convergence en probbilité. Preuve. C est une conséquence immédite de l inéglité de Mrkov vec moment, cf. proposition 4.38, puisque ε >, P ( Y n Y ε ) E( Y n Y p) ε p. Remrque 6.15. Pr contre, il n y ucune impliction entre convergence p.s. et convergence en moyenne d ordre p. Pour voir que l convergence L p n implique ps l convergence p.s., le contre exemple déjà vu à l remrque 6.9 fit l ffire cr on vérifie (exercice) que l suite Y n de cet exemple converge u sens L p vers (pour tout p 1). Voici mintennt un contre exemple montrnt que l convergence p.s. n implique ps l convergence L p. On prend U de loi uniforme sur [, 1] et on pose Y n := n 2 1 [,1/n] (U). On voit fcilement que P ( {ω Ω; lim n + Y n(ω) = }) = P ( U ], 1] ) = 1, d où l convergence presque-sûre de Y n vers l v.. constnte. D utre prt, Y n est une v.. discrète ne prennt que les vleurs ou n 2 et on imméditement E Y n p = n 2p 1. Le fit que ce moment bsolu d ordre p tende vers + vec n interdit l convergence L p de l suite (Y n ). Pour s en convincre, supposons que Y n converge vers Y u sens L p. Alors E Y p doit être fini et pr l inéglité de convexité (6.2), on obtient E Y n p 2 p 1 E Y p + 2 p 1 E Y n Y p, ce qui est impossible puisque le premier membre tend vers l infini vec n tndis que le second membre reste borné. Il y une hiérrchie entre les convergences L p pour diverses vleurs de p et c est l même que celle étblie à l proposition 4.37 pour l existence des moments bsolus d ordre p. Proposition 6.16 (hiérrchie des convergences L p ). Si 1 p < r < + et si Y n Y, lors Y n L p n + Y. L r n + Preuve. Posons Z n := Y n Y. Il s git de montrer que l convergence vers de E(Z r n) implique celle de E(Z p n) vers. Fixons ε rbitrire dns ], 1[. On commence pr le découpge E(Z p n) = + P (Z p n > t) dt = 1 P (Z p n > t) dt + + 1 P (Z p n > t) dt. (6.21) 2 Ch. Suquet, Cours I.P.É. 21
6.1. Convergences de suites de v.. Pour tout réel x 1, on x p x r puisque p < r. On en déduit que l inclusion d évènements {Zn p > t} {Zn r > t} est vrie pour tout t 1, d où + 1 P (Z p n > t) dt + 1 P (Z r n > t) dt E(Z r n). (6.22) Comme ce dernier mjornt tend vers qund n tend vers +, on peut trouver un entier n 1 = n 1 (ε) tel que n n 1, Rppelnt que ε < 1, on d utre prt d où finlement 1 P (Z p n > t) dt = n N, 1 ε ε = ε + + 1 P (Z p n > t) < ε. (6.23) P (Z p n > t) dt + dt + 1 ε 1 ε 1 ε P (Z p n > t) dt P (Z n > t 1/p ) dt ε + (1 ε)p (Z n > ε 1/p ), P (Z p n > t) dt P (Z p n > t) dt ε + P (Z n > ε 1/p ). (6.24) Pr l proposition 6.14, l convergence de Z n vers u sens L r implique s convergence en probbilité 5. Pr conséquent P (Z n > ε 1/p ) converge vers qund n tend vers +, ce qui nous ssure de l existence d un entier n 2 = n 2 (ε) tel que n n 2, 1 On déduit de (6.21), (6.23) et (6.25) que P (Z p n > t) dt 2ε. (6.25) n n := mx(n 1, n 2 ), E(Z p n) < 3ε. Comme ε étit rbitrire dns ], 1[, E(Z p n) tend bien vers qund n tend vers +. Remrque 6.17. L démonstrtion clssique de l proposition 6.16 est plus rpide que celle présentée ci-dessus puisqu elle est une conséquence immédite de l inéglité (E X p ) 1/p (E X r ) 1/r, 1 p < r < +. On pourr éventuellement voir cette inéglité en exercice. L preuve proposée ci-dessus, certes moins élégnte, nénmoins l vntge de donner comme sous-produit le résultt suivnt qui son intérêt propre. 5. Remrquer que E(Z r n) = E Z n r et donc que l convergence L r de Z n vers équivut à l convergence vers de E(Z r n). Cette simplifiction est prticulière à l limite, on n bien sûr ps équivlence en générl entre convergence de Z n vers Z u sens L r et convergence de E Z n r vers E Z r. Ch. Suquet, Cours I.P.É. 21 21
Chpitre 6. Théorèmes limites Proposition 6.18. Si l suite de vribles létoires Y n est bornée pr une constnte positive c (ou plus lrgement si pour tout n, P ( Y n c) = 1) et converge en probbilité vers Y, lors Y n converge u sens L p vers Y, pour tout p 1. En prticulier pour p = 1, on en déduit l interversion limite espérnce : lim n + EY n = EY. L rgument de l preuve est essentiellement le même que ci-dessus, modulo quelques dpttions mineures que l on vous lisse le soin de rédiger en exercice. Nous llons mintennt étblir le célèbre théorème de convergence dominée qui est très utile pour l interversion limite espérnce. Théorème 6.19 (convergence dominée). On suppose que les vribles létoires réelles Y n (n 1), Y et Z définies sur le même espce probbilisé (Ω, F, P ) vérifient ) Y n converge presque-sûrement vers Y qund n tend vers + ; b) pour tout n 1, Y n Z p.s. ; c) Z est intégrble. Dns ces conditions, 1. les Y n et Y sont intégrbles ; 2. Y n converge vers Y u sens L 1, i.e. E Y n Y ; 3. on l interversion limite espérnce : lim n + EY n = EY. Preuve. En utilisnt ), b) et le lemme 6.2, on vérifie fcilement l existence d un évènement Ω F de probbilité 1 tel que ω Ω, n 1, Y n (ω) Z(ω) et Y (ω) Z(ω). (6.26) Remrquons que pour tout évènement A, P (A Ω c ) P (Ω c ), d où : qund P (Ω ) = 1, A F, P (A Ω c ) = et P (A Ω ) = P (A). (6.27) On en déduit de (6.26) et (6.27) que t, P ( Y n > t) = P ({ Y n > t} Ω ) P ({Z > t} Ω ) = P (Z > t) et de même vec Y à l plce de Y n. En intégrnt sur R + reltivement à t, on obtient grâce à c) les inéglités E Y n EZ < +, E Y EZ < +, qui étblissent l intégrbilité des Y n et de Y. Une fois étblie cette intégrbilité et donc l existence de EY n et EY, on remrque que l interversion limite espérnce est une conséquence immédite de l convergence L 1 en rison de l inéglité : EY n EY = E(Y n Y ) E Y n Y. 22 Ch. Suquet, Cours I.P.É. 21
6.1. Convergences de suites de v.. Il nous reste lors à prouver l convergence L 1, utrement dit, en posnt Z n := Y n Y, l convergence vers de EZ n. Pour cel on utilise comme dns l preuve de l proposition 6.16 un découpge en 3 de l intégrle définissnt EZ n en écrivnt pour ε > rbitrire et b = b(ε) convenblement choisi, + = ε + b + +. Voyons d bord le choix de b. Pr inéglité tringulire, ε b Z n 2Z sur Ω, ce qui grâce à (6.27) nous donne pour tout t >, P (Z n > t) P (2Z > t). L vrible létoire Z étnt intégrble pr hypothèse c), il en est de même pour 2Z, ce qui implique l convergence dns R + de l intégrle de Riemnn générlisée + P (2Z > t) dt. On peut donc choisir b ssez grnd (et supérieur à ε) pour que + P (2Z > t) dt < ε. On lors b n N, + P (Z n > t) dt b b + P (2Z > t) dt < ε. (6.28) Ensuite on contrôle l intégrle b P (Z n > t) dt en écrivnt b P (Z n > t) dt ε dt + b ε P (Z n > t) dt ε + (b ε)p (Z n > ε) ε + bp (Z n > ε). Pr l hypothèse ), Z n converge presque-sûrement vers, donc converge ussi en probbilité vers. On peut donc trouver un entier n = n (ε) tel que bp (Z n > ε) < ε pour tout 6 n n. On lors n n, b P (Z n > t) dt < 2ε. (6.29) En recollnt les morceux à prtir de (6.28) et (6.29), on obtient n n, EZ n = b P (Z n > t) dt + + b P (Z n > t) dt < 3ε. Comme ε > étit rbitrire, ceci étblit l convergence vers de EZ n et chève l preuve. 6.1.3 Biln sur les convergences de v.. Arrivé à ce stde, il est bon de fire le point sur les différents modes de convergence étudiés. Le digrmme de l figure 6.2 résume les reltions entre ces modes de convergence. Les flèches en trit plein représentent des implictions (si l suite converge selon le mode de l cse de déprt, lors elle converge ussi selon celui de l cse d rrivée). Les flèches en tirets signifient l existence d une sous-suite convergente selon le mode de l cse d rrivée. L convergence en loi ser étudiée ultérieurement. 6. Noter que b dépend de ε et peut très bien tendre vers + qund ε tend vers, mis que l on trville vec un ε rbitrire fixé, donc ussi vec b fixé. Ch. Suquet, Cours I.P.É. 21 23
Chpitre 6. Théorèmes limites L r L p (1 p < r < + ) p.s. Pr. en loi Fig. 6.2 Digrmme des convergences des suites de v.. Signlons deux propriétés communes ux trois modes de convergence étudiés jusqu ici (vérifiction lissée u lecteur). D bord l limite pour ces modes de convergence n est ps à strictement prler unique. Elle l est modulo l églité presque sûre. Notons (m), (m ) l un des trois modes de convergence (p.s., en probbilité ou L p ). On peut vérifier que si Y n converge vers Y u sens (m) et vers Y u sens (m) lors Y = Y presque-sûrement (l réciproque est évidente). D utre prt si Y n converge u sens (m) vers Y et u sens (m ) vers Y, ces deux convergences impliquent l convergence en probbilité de Y n vers Y et vers Y, donc l églité p.s. de Y et Y. Chcun des trois modes de convergence est comptible vec l structure d espce vectoriel. Si X n R. (m) X et Y n (m) Y, X n + Y n (m) X + Y et X n (m) X pour tout 6.2 Loi des grnds nombres Nous bordons mintennt les lois des grnds nombres. Il s git d étudier l convergence des moyennes rithmétiques S n /n construites à prtir d une suite de vribles létoires (X i ) i 1 en posnt S n := X 1 + + X n. Si S n /n converge en probbilité, on prle d une loi fible des grnds nombres, tndis que si elle converge presque-sûrement on prle d une loi forte. 6.2.1 Loi fible des grnds nombres Rppelons que si X est de crré intégrble (EX 2 < + ), s vrince est définie pr Vr X := E(X EX) 2. 24 Ch. Suquet, Cours I.P.É. 21
6.2. Loi des grnds nombres Les X k sont dites deux à deux non-corrélées si Cov(X i, X j ) = pour tous i, j distincts. Ceci se produit en prticulier lorsque les X k sont deux à deux indépendntes, cf. prop. 5.48. Pour des X k deux à deux non-corrélées, on déduit imméditement de (5.9) l églité n Vr S n = Vr X k. (6.3) k=1 Proposition 6.2 (inéglité de Bienymé-Tchebycheff). Si les X k sont de crré intégrble et deux à deux non-corrélées, t >, Preuve. Il suffit d écrire : ( n ) P (X k EX k ) t 1 n Vr X t 2 k. (6.31) k=1 P ( S n ES n t ) = P ( S n ES n 2 t 2) 1 t 2 E(S n ES n ) 2 (6.32) k=1 = 1 t 2 Vr S n, où l inéglité dns (6.32) est l inéglité de Mrkov ppliquée à l vrible létoire positive S n ES n 2. On conclut vec (6.3). Théorème 6.21 (loi fible des grnds nombres). Si les X k sont de même loi, de crré intégrble et deux à deux non-corrélées, on l convergence en probbilité : 1 n n k=1 X k Pr n + EX 1. (6.33) Preuve. Comme les X k ont même loi, on pour tout k les églités EX k = EX 1 et Vr X k = Vr X 1. Comme elles sont ussi deux à deux non-corrélées, (6.3) nous donne Vr S n = n Vr X 1. Pr linérité de l espérnce on ussi ES n = nex 1. L inéglité de Bienymé-Tchebycheff nous dit lors que : t >, P ( S n ES n t ) = P ( S n nex 1 t ) n Vr X 1 t 2. Posnt t = nε, on en déduit : ε >, n N, P ( S n nex 1 nε ) ( S ) n = P n EX 1 ε Pour tout ε > fixé, on insi ( S ) n P n EX 1 ε Vr X 1 nε 2 n +, n Vr X 1 n 2 ε 2 = Vr X 1 nε 2. ce qui étblit l convergence en probbilité de l suite de vribles létoires S n /n vers l vrible létoire constnte EX 1. Ch. Suquet, Cours I.P.É. 21 25
Chpitre 6. Théorèmes limites 6.2.2 Loi forte des grnds nombres Dns le cdre de ce cours, nous limiterons notre étude des lois fortes des grnds nombres u cs où les X k sont i.i.d. (indépendntes identiquement distribuées), c est-àdire indépendntes et de même loi. Théorème 6.22 (loi forte des grnds nombres de Khintchine). On suppose les X k indépendntes, de même loi et E X 1 < +. Alors 1 n n k=1 X k p.s. n + EX 1. (6.34) Ce résultt est le meilleur possible en rison du théorème suivnt. Théorème 6.23 (réciproque de l l.f.g.n. de Khintchine). Soit (X k ) k 1 une suite de vribles létoires indépendntes et de même loi telle que S n /n converge presque sûrement. Alors E X 1 < + et l limite p.s. de S n /n est l constnte EX 1. L démonstrtion de ces deux théorèmes sort du cdre de ce cours. Nous nous contenterons de prouver le théorème 6.22 sous l hypothèse plus restrictive E(X 2 1) < +. Preuve de (6.34) pour des X k i.i.d. de crré intégrble. Puisque les X k ont même loi, elles sont intégrbles comme X 1 et de même espérnce. On en déduit que S n et S n /n sont intégrbles et que pr linérité de l espérnce, E ( Sn ) = 1 n n ES n = 1 n (nex 1) = EX 1. Posons X k := X k EX k et S n := n k=1 X k = S n nex 1. Alors S n/n = S n /n EX 1, donc l convergence p.s. de S n /n vers EX 1 équivut à l convergence p.s. de S n/n vers (noter ussi que les X k sont i.i.d., propriété héritée des X k). On ne perd donc ps de générlité en supposnt désormis pour le confort d écriture que EX 1 =. On lors Vr X 1 = E(X 2 1) =: σ 2 et il s git mintennt de prouver que M n := 1 n S n p.s.. (6.35) n + Montrons dns un premier temps que l sous-suite (M n 2) n 1 converge p.s. vers. En effet l inéglité de Bienymé-Tchebycheff nous donne pour tout ε >, On en déduit que P ( M n 2 ε) = P ( S n 2 n 2 ε) Vr(S n 2) ε 2 n 4 = n2 Vr X 1 ε 2 n 4 = σ2 ε 2 n 2. ε >, + n=1 P ( M n 2 ε) σ2 ε 2 + n=1 1 n 2 < +, 26 Ch. Suquet, Cours I.P.É. 21
6.2. Loi des grnds nombres ce qui implique pr l proposition 6.6 M n 2 p.s.. (6.36) n + Pour tout n N, notons r(n) l prtie entière de n 1/2, ce qui nous donne l encdrement r(n) 2 n < ( r(n) + 1 ) 2. (6.37) L suite d entiers (r(n)) n 1 tend vers l infini comme n, mis vec des blocs de vleurs répétées de plus en plus longs : r(n) = 4 pour n [16, 24[, r(n) = 5 pour n [25, 35[, etc. Pour cette rison (M r(n) 2) n 1 n est ps à proprement prler une sous-suite de (M n ) n 1. Nous llons nénmoins voir que l on peut rccrocher le comportement symptotique de (M n ) n 1 à celui de (M r(n) 2) n 1 en commençnt pr écrire : M n = 1 X j + 1 n n 1 j r(n) 2 où l on posé r(n) 2 <j n Pr indépendnce des X j, on X j = r(n)2 n T n := 1 n 1 r(n) 2 r(n) 2 <j n 1 j r(n) 2 X j + T n = r(n)2 n M r(n) 2 + T n, X j. Vr T n = 1 n 2 ( n r(n) 2 ) Vr X 1. (6.38) En utilisnt (6.37), 1 ( ) ( ) 2 n r(n) 2 r(n) + 1 r(n) 2 = 2r(n) + 1 2n1/2 + 1 3 n 2 n 2 n 2 n 2 n. 3/2 En reportnt cette mjortion dns (6.38) et en utilisnt l inéglité de Mrkov vec moment d ordre 2 (noter que ET n = ), on obtient ε >, P ( T n > ε) Vr T n 3σ2 1 ε 2 ε 2 n. 3/2 Ce mjornt étnt le terme générl d une série convergente, on en déduit pr une nouvelle ppliction de l proposition 6.6 : Pour conclure, on écrit T n p.s.. (6.39) n + M n = T n + r(n)2 n M r(n) 2. Comme r(n) 2 /n est toujours dns [, 1], on déduit de (6.36) et (6.39) que M n converge presque sûrement vers zéro 7. 7. Noter que les suites (M r(n) 2) n 1 et (M n 2) n 1 ne sont ps les mêmes. L première des séquences de termes consécutifs répétés de plus en plus longues et c est en effçnt ces répétitions que l on retrouve l deuxième. On voit insi que ces deux suites ont même limite. À vous de d écrire proprement l justifiction de ce point. Ch. Suquet, Cours I.P.É. 21 27
Chpitre 6. Théorèmes limites L ppliction l plus simple et ussi une des plus importntes du théorème 6.22 est l convergence des fréquences de succès dns une suite d épreuves répétées de Bernoulli indépendntes. Ce résultt explique posteriori l pproche «fréquentiste» dns l définition d une probbilité. En effet si (X k ) k 1 est une suite de vribles létoires de Bernoulli indépendntes et de même prmètre p, le théorème 6.22 nous donne l convergence presque sûre de n 1 S n vers EX 1 = p. Soit mintennt A F un évènement et (A k ) k 1 une suite d évènements indépendnts de même probbilité que A. En prennt X k = 1 Ak et en notnt que E1 Ak = P (A k ) = P (A), on obtient 1 n n k=1 p.s. 1 Ak P (A). n + Pr exemple si A est l évènement «obtention du cinq lors du lncer d un dé équilibré», ceci nous dit que l fréquence d obtention du cinq en n lncers converge presque sûrement vers 1/6 lorsque n tend vers l infini. 6.2.3 L iguille de Buffon À titre d illustrtion historique de l loi forte des grnds nombres, nous présentons mintennt une méthode expérimentle pour obtenir une pproximtion numérique du nombre π dont l intérêt est essentiellement d ordre culturel 8. Cette méthode été proposée en 1 777 pr le célèbre nturliste Buffon 9. On trce sur une surfce plne horizontle des droites prllèles équidistntes, séprées pr une distnce (on peut pr exemple utiliser les rinures d un prquet). On lisse tomber sur cette surfce une iguille de longueur l et une fois l iguille immobilisée, on observe si elle coupe l une des droites du réseu. On répète l expérience en notnt l fréquence des intersections. Lorsque le nombre d expériences ugmente indéfiniment, cette fréquence converge selon Buffon vers p = 2l permettnt insi d obtenir une estimtion expérimentle du nombre π. π «Échec» «Succès» Cherchons une modélistion de cette expérience. On note Y l distnce du milieu de l iguille à l droite du réseu l plus proche. Y prend ses vleurs dns [, ]. On note Φ 2 8. C est ussi un excellent problème de révision. 9. Georges Louis Leclerc, comte de Buffon (177 1788), uteur de l Histoire nturelle, orgnisteur du Jrdin des Plntes de Pris. 28 Ch. Suquet, Cours I.P.É. 21
6.2. Loi des grnds nombres une mesure de l ngle entre les droites du réseu (toutes orientées dns le même sens) et l iguille orientée du chs vers l pointe. Φ prend ses vleurs dns [, 2π] (pr exemple) 1. Y et Φ sont des vribles létoires. L connissnce du couple (Y (ω), Φ(ω)) suffit pour svoir s il y ou non intersection. Y l sin Φ 2 Nous ferons les hypothèses suivntes sur les vribles létoires Y et Φ : (H 1 ) Y suit l loi uniforme sur [, ]. 2 (H 2 ) Φ suit l loi uniforme sur [, 2π]. (H 3 ) Y et Φ sont indépendntes. On note E l événement «l iguille coupe l une des droites du réseu». L longueur de l projection de l demi-iguille sur une droite orthogonle u réseu est Z = l sin Φ. Il 2 y donc intersection si et seulement si l distnce Y du centre de l iguille à l droite du réseu l plus proche est inférieure ou égle à Z. Ceci nous permet d écrire l évènement E sous l forme : { E = Y l2 } sin Φ. Comme Y et Φ sont indépendntes, l loi du couple est le produit des lois mrginles : P (Y,Φ) = P Y P Φ. Comme ces lois mrginles sont à densités pr rpport à λ 1, on en déduit que P (Y,Φ) est à densité f Y f Φ pr rpport à λ 2. D où f (Y,Φ) (y, t) = f Y (y)f Φ (t) = 2 1 [,/2](y) 1 2π 1 [,2π](t) = 1 π 1 [,/2] [,2π](y, t). On voit insi que le couple (Y, Φ) suit l loi uniforme sur le rectngle [, /2] [, 2π]. Notons D le borélien de R 2 défini pr D := {(t, y) [, 2π] [, /2]; y l2 } sin t. Comme l évènement E s écrit ussi {(Φ, Y ) D}, on peut clculer P (E) en utilisnt l loi du couple (Φ, Y ) qui est l loi uniforme sur [, 2π] [, /2] : P (E) = P ( (Φ, Y ) D ) = P (Φ,Y ) (D) = f (Φ,Y ) (y, t) dy dt D = 1 π λ 2 = 1 π λ 2(D), ( D [, 2π] [, /2] ) 1. On pourrit ussi utiliser les ngles de droites, Φ serit lors à vleurs dns un intervlle de longueur π. Ch. Suquet, Cours I.P.É. 21 29
Chpitre 6. Théorèmes limites en remrqunt que D [, 2π] [, /2]. Le clcul de P (E) se réduit insi à celui de l ire de l hypogrphe de l fonction g : t l 2 sin t 1 [,2π](t). 2 l 2 Pr conséquent Finlement, 2π λ 2 (D) = 2π l π sin t dt = l sin t dt = 2l. 2 P (E) = 2l π. On effectue une suite de lncers de l iguille et on note E i l évènement «lors du ième lncer, l iguille intersecte une des droites du réseu». On pose X i = 1 Ei et F n := 1 n n X i. Les X i sont des vribles létoires de Bernoulli, de prmètre p := P (E i ) = P (E). Elles sont clirement intégrbles, puisque bornées. Les E i forment une suite d évènements mutuellement indépendnts et de même probbilité p. Il en résulte que les X i forment une suite de vribles létoires indépendntes et de même loi Bern(p). Pr l loi forte des grnds nombres pour des vribles i.i.d. et intégrbles, F n := 1 n n i=1 X i i=1 p.s. EX 1 = P (E). n + Compte-tenu du clcul de P (E), on peut réécrire ce résultt sous l forme : 2l F n p.s. n + π. L interpréttion physique est l suivnte. Si on rélise une série de lncers vec n grnd, l vleur F n (ω) observée nous fournir l pproximtion 2l F n (ω) π. On considère insi qu il est physiquement impossible d observer un ω n pprtennt ps à l évènement de probbilité 1 {F n converge vers p}. 21 Ch. Suquet, Cours I.P.É. 21
6.2. Loi des grnds nombres Le document de l pge 212 représente les résultts de 12 lncers rélisés vec une llumette et un réseu trcé sur une feuille de formt A4. On ici l = = 4, 5 cm et p = 2, 637. Les lncers sont regroupés pr dizine. Les bits ou 1 sont les π vleurs observées pour X i (ω). Après chque dizine on noté le nombre d intersections observées sur l dizine et le nombre d intersections cumulé depuis le début des lncers. L tble 6.1 présente les fréquences observées F 1k pour k = 1,..., 12. 1k 1 2 3 4 5 6 7 8 9,6,65,6,625,6,583,571,575,611 1,6,627,633,623,629,67,66,66,617,616 2,615,624,627,63,629,628,623,619,618,61 3,61,613,69,66,69,63,6,6,65,61 4,61,612,614,614,69,69,615,615,619,614 5,618,618,619,621,62,622,621,619,621,624 6,622,621,626,627,625,628,624,621,622,623 7,626,625,626,629,628,625,628,632,635,637 8,637,64,635,635,636,634,634,636,637,638 9,638,635,635,632,633,633,633,63,628,629 1,629,628,63,63,626,623,623,621,62,622 11,622,622,622,623,626,626,628,628,628,627 12,627 Tb. 6.1 Tbleu des fréquences observées Cette expérience permet de proposer l estimtion : π 2, 627 3, 1898. Si vous vez l ptience et le loisir de réliser votre propre expérience, vous trouverez probblement une vleur légèrement différente... Bien entendu, cette méthode pour clculer π n est ps très performnte. On peut montrer que s vitesse de convergence est en O(n 1/2 ). Son intérêt est essentiellement d ordre culturel et historique. Ch. Suquet, Cours I.P.É. 21 211
Chpitre 6. Théorèmes limites Résultts de 12 lncers 111111 6 6 111111111 9 69 11111111 8 131 1111111 7 13 1111111 7 76 1111111 7 138 11111 5 18 11111 5 81 1111111 7 145 1111111 7 25 1111111 7 88 111111 6 151 11111 5 3 111 3 91 111111 6 157 11111 5 35 111111 6 97 11111 5 162 11111 5 4 111111 6 13 11111 5 167 111111 6 46 11111111 8 111 111111 6 173 111111111 9 55 111111 6 117 1111 4 177 11111 5 6 111111 6 123 111111 6 183 1111111 7 19 1111111 7 251 111111 6 315 11111 5 195 1111111 7 258 1111111 7 322 11111 5 2 111111 6 264 1111111 7 329 1111111 7 27 1111 4 268 111111 6 335 1111 4 211 111111 6 274 1111111 7 342 11111 5 216 111111111 9 283 111111 6 348 111111 6 222 111111 6 289 11111 5 353 11111111 8 23 11111111 8 297 1111111 7 36 11111111 8 238 1111 4 31 11111111 8 368 111111 6 244 11111111 8 39 11111 5 373 111111 6 379 111111 6 444 11111111 8 518 111111111 9 388 1111111 7 451 111 3 521 1111111 7 395 11111111 8 459 111111 6 527 11111 5 4 111111 6 465 1111111 7 534 11111111 8 48 1111 4 469 11111 5 539 1111 4 412 11111111 8 477 111111 6 545 1111 4 416 1111111111 1 487 11111111 8 553 1111111 7 423 11111111 8 495 11111111 8 561 1111111 7 43 11111111 8 53 1111111 7 568 11111111 8 438 1111111 7 51 111111 6 574 1111 4 578 11111 5 634 111111 6 69 111111 6 584 111111111 9 643 1111111 7 697 1111 4 588 111111 6 649 1111111 7 74 1111111 7 595 11 2 651 1111111111 1 714 111111 6 61 111 3 654 111111 6 72 1111111 7 68 111111 6 66 11111111 8 728 111 3 611 1111 4 664 1111111 7 735 1111 4 615 111111 6 67 111111 6 741 11111111 8 623 11111111 8 678 11111 5 746 111111 6 629 111111 6 684 111111 6 752 212 Ch. Suquet, Cours I.P.É. 21
Annexe A Intégrle de Riemnn sur [, b] A.1 Construction Soit [, b] un intervlle fermé borné de R. On ppelle subdivision de [, b] toute suite finie du type = {x = < x 1 < < x n = b}. Pour une fonction bornée f : [, b] R, ( < < b < + ), on définit ses sommes de Drboux inférieure S (f) et supérieure S (f) pr S (f) := n k=1 (x k x k 1 ) inf f, S (f) := [x k 1,x k ] n k=1 (x k x k 1 ) sup f. [x k 1,x k ] Pour une illustrtion, voir les figures A.1 et A.2. y x k x k+1 b x Fig. A.1 S (f) 213
Annexe A. Intégrle de Riemnn sur [, b] y x k x k+1 b x Fig. A.2 S (f) On dit que l subdivision est un rffinement de si l ensemble des vleurs de l suite finie est inclus dns celui des vleurs de l suite, ce que nous noterons vec un léger bus. Il est fcile de vérifier que S (f) S (f) et S (f) S (f). Les figures A.3 et A.4 illustrent l effet de l djonction à l subdivision des figures A.1 et A.2 de deux nouveux points. Les intégrles de Riemnn inférieure I (f) et supérieure I (f) sont définies pr I (f) := sup S (f), I (f) := inf S (f), le supremum et l infimum étnt pris sur toutes les subdivisions de [, b]. Pour 1 et 2 subdivisions de [, b] on clirement S 1 (f) S 1 2 (f) S 1 2 (f) S 2 (f), d où S 1 (f) S 2 (f). En prennt successivement le sup sur tous les 1, puis l inf sur tous les 2, on en déduit I (f) I (f), inéglité vérifiée pr toute fonction bornée f : [, b] R. Définition A.1. On dit que f bornée [, b] R est Riemnn intégrble si vec les nottions ci-dessus, I (f) = I (f). Dns ce cs on définit son intégrle u sens de Riemnn notée b f(x) dx pr b f(x) dx := I (f) = I (f). 214 Ch. Suquet, Cours I.P.É. 21
A.1. Construction y x k x k+1 b x Fig. A.3 Si, S (f) S (f) y x k x k+1 b x Fig. A.4 Si, S (f) S (f) Ch. Suquet, Cours I.P.É. 21 215
Annexe A. Intégrle de Riemnn sur [, b] Il est commode de donner ussi une définition de b f(x) dx lorsque b <. Cette définition peut se justifier en reprennt toute l étude précédente vec des subdivisions de [b, ] pr des suites finies décroissntes 1 = x > x 1 > > x n 1 > x n = b. En conservnt les mêmes définitions de S (f) et S (f), le seul chngement pr rpport ux subdivisions croissntes de [b, ] est que les (x k x k 1 ) sont négtifs ce qui implique une inversion des inéglités entre S (f) et S (f), on mintennt S (f) S (f). Associons à chque subdivision décroissnte de [b, ], l subdivision retournée = {x, x 1,..., x n} définie pr x = x n, x 1 = x n 1,..., x n = x. Alors est une subdivision croissnte de [b, ] et S (f) = S (f), S (f) = S (f). On en déduit imméditement que I (f,, b) := sup S (f) = inf S (f) =: I (f, b, ), (A.1) I (f,, b) := inf S (f) = sup S (f) =: I (f, b, ), (A.2) les infim et suprem indexés pr s entendnt pour toute subdivision décroissnte de à b et ceux indexés pr pour toute subdivision croissnte de [b, ]. On définit lors l intégrbilité de f de à b pr l condition I (f,, b) = I (f,, b), dont on voit pr (A.1) et (A.2) qu elle équivut à I (f, b, ) = I (f, b, ), c est-à-dire à l intégrbilité de f sur [b, ]. En définissnt enfin b f(x) dx comme l vleur commune de I (f,, b) et I (f,, b), on obtient b f(x) dx = f(x) dx, cette dernière intégrle relevnt de l b définition A.1. Tout ceci légitime l définition formelle suivnte. Définition A.2. Si < b < < +, on dit que f est Riemnn intégrble de à b si elle est Riemnn intégrble sur [b, ] et on pose dns ce cs : b f(x) dx := b f(x) dx. (A.3) Remrque A.3 (vrible d intégrtion). Dns l écriture f(x) dx, l «vrible d intégrtion» x est «muette», on peut l remplcer pr n importe quelle utre lettre (suf b ici, b ou f). Cette vrible joue le même rôle que l indice i de sommtion dns n i=1 u i qui est lui ussi muet. Remrque A.4 (intégrle de Riemnn et ire). Soit f une fonction positive et Riemnn intégrble sur [, b]. On interprète clssiquement b f(x) dx comme l ire de l hypogrphe de f entre et b, i.e. de l région du pln délimitée pr l xe des bscisses, les droites verticles d éqution x = ou x = b et le grphe 2 de f, l courbe d éqution y = f(x), x [, b]. Voici une justifiction informelle de cette ffirmtion, dont on pourr se contenter en première lecture. Reprenons l fonction f des figures A.1 et A.2. L hypogrphe H de f est représenté figure A.5. On peut se convincre «visuellement», cf. figure A.1, 1. Rppelons que pour tous réels et b, [, b] est défini comme l ensemble des x réels tels que x b. Ainsi pour b <, [, b] est l ensemble vide. C est pour cel que l on subdivise ici [b, ] et non [, b]. De même on prler d intégrle de f de à b mis ps d intégrle de f sur [, b] qund b <. 2. D où le nom «hypogrphe», littérlement ce qui est sous le grphe. 216 Ch. Suquet, Cours I.P.É. 21
A.1. Construction y b x Fig. A.5 Hypogrphe H de f entre et b que pour toute somme de Drboux inférieure l ire des rectngles coloriés égle à S (f) est inférieure à l ire de l hypogrphe de f. De même cf. figure A.2, pour toute somme de Drboux supérieure, l ire des rectngles coloriés égle à S (f) est supérieure à l ire de l hypogrphe. L ire de H est donc un mjornt de toute S et un minornt de toute S. D où I (f) = sup S (f) ire(h) inf S (f) = I (f). Pr Riemmn intégrbilité de f, I (f) = I (f) = b f(x) dx, d où ire(h) = b f(x) dx. Pour les lecteurs exigents que l remrque A.4 lisserit instisfits, nous proposons et démontrons ci-dessous un énoncé plus précis. Pour cel, il convient d bord de s interroger sur l définition mthémtique de l ire de H. Dns le cdre de ce cours, nous vons dmis l existence de l mesure de Lebesgue λ 2 sur R 2, définie comme l unique mesure µ sur l tribu borélienne de R 2 vérifint µ(]x 1, x 2 ] ]y 1, y 2 ]) = (x 2 x 1 )(y 2 y 1 ) pour tout pvé semi-ouvert ]x 1, x 2 ] ]y 1, y 2 ] de R 2, voir l exemple 2.13 p. 56. C est cette mesure de Lebesgue qui donne un sens mthémtique précis à l notion d ire. On se propose donc de montrer que λ 2 (H) = b f(x) dx. Pour que cel it un sens, encore fut-il que H soit un borélien de R 2. Une condition suffisnte pour que H soit un borélien de R 2 est que l fonction f soit borélienne, c est-à-dire mesurble (voir def. 3.1 93) pour les tribus boréliennes de [, b] et de R. L preuve de cette ffirmtion sort du progrmme de ce cours 3. Signlons simplement que tous les exemples de fonctions Riemmn intégrbles donnés dns l suite de ce document fonctions monotones, continues, réglées sont boréliennes. Les seules propriétés de λ 2 utilisées dns ce qui suit sont l croissnce et l dditivité finie propriétés vérifiées pr toute mesure, voir p. 51 et le fit que les frontières des pvés sont de λ 2 -mesure nulle 4, voir l proposition 2.14 v). 3. Voir le cours d IFP 23-24 chpitre 5. 4. En rélité on seulement besoin de svoir que si J est un segment verticl {} [y1, y 2 ], λ 2 (J) = et de même pour un segment horizontl. Ceci se démontre fcilement en exercice en utilisnt l croissnce Ch. Suquet, Cours I.P.É. 21 217
Annexe A. Intégrle de Riemnn sur [, b] Proposition A.5. Soit f : [, b] R une fonction positive et Riemnn intégrble sur [, b]. On suppose de plus que son hypogrphe entre et b H := {(x, y) R 2 ; x b et y f(x)} (A.4) est un borélien de R 2. Alors λ 2 (H) = b f(x) dx, utrement dit l intégrle de f entre et b est l ire de l hypogrphe de f entre et b. (A.5) Preuve. Soit = {x = < x 1 < < x n = b} une subdivision quelconque de [, b]. Notons pour k = 1,..., n, m k := Définissons les «rectngles» R,k pr inf f, M k := sup f. [x k 1,x k ] [x k 1,x k ] R,1 := [, x 1 ] [, m 1 ], R,k :=]x k 1, x k ] [, m k ] pour k = 2,..., n, et notons R,k les rectngles obtenus en remplçnt m k pr M k, k = 1,..., n. Posons enfin R := n R,k, R := n R,k. k=1 k=1 Commençons pr justifier l double inclusion, R H R. (A.6) Soit (x, y ) un élément quelconque de l réunion R. Il pprtient donc à un R,k d où x k 1 x x k et y m k f(x ) cr m k est l infimum de f sur [x k 1, x k ]. Le couple (x, y ) vérifie insi les inéglités x k 1 x x k b et y f(x), donc pprtient à H. Ceci justifie l première inclusion dns (A.6). Soit mintennt (x, y ) un élément quelconque de H, donc vérifint x b et y f(x ). L subdivision induit l prtition de [, b] en les intervlles J 1 := [, x 1 ], J k :=]x k 1, x k ], k = 2,..., n. Il existe donc un unique indice k entre 1 et n tel que J k contienne x. On lors y f(x ) M k cr M k est le supremum de f sur [x k 1, x k ]. Ainsi (x, y ) pprtient à R,k, donc ussi à R, ce qui justifie l deuxième inclusion dns (A.6). Comme R, H et R sont des boréliens de R 2, on deduit de (A.6) pr croissnce de λ 2 que, λ 2 (R ) λ 2 (H) λ 2 (R ). (A.7) Clculons mintennt λ 2 (R ). Les R,k étnt deux à deux disjoints, on pr dditivité finie de λ 2 : n λ 2 (R ) = λ 2 (R,k ). (A.8) de λ. Fites le! k=1 218 Ch. Suquet, Cours I.P.É. 21
A.2. Riemnn intégrbilité Pr l proposition 2.14 v) ou pr l note 4 p. 217, on pour tout k = 1,..., n, λ 2 (R,k ) = (x k x k 1 )m k, d où en reportnt dns (A.8), λ 2 (R ) = S (f). De même il est clir que λ 2 (R ) = S (f). On déduit lors de (A.7) que, S (f) λ 2 (H) λ 2 (R ). (A.9) L première inéglité dns (A.9) nous dit que le réel λ 2 (H) qui ne dépend ps de mjore toutes les sommes de Drboux inférieures S (f). Il mjore donc ussi leur supremum I (f). Pr l deuxième inéglité, λ 2 (H) minore toutes les S (f), donc minore ussi leur infimum I (f). Nous obtenons insi l encdrement I (f) λ 2 (H) I (f). Comme f est Riemnn intégrble, I (f) = I (f), donc λ 2 (H) = I (f) = I (f) = f(x) dx. b Remrque A.6. L mesure λ 2 étnt invrinte pr l symétrie (x, y) (x, y) cf. prop. 2.14 ii), on obtient imméditement une version de l proposition A.5 pour une fonction g négtive sur [, b] en remplçnt H pr En effet en posnt f = g, il vient H := {(x, y) R 2 ; x b et g(x) y }. λ 2 (H ) = λ 2 (H) = b f(x) dx = b g(x) dx. (A.1) A.2 Riemnn intégrbilité Dns cette section nous exminons l Riemnn intégrbilité de certines fmilles de fonctions. Les deux plus importntes en prtique sont celle des fonctions monotones et celle des fonctions continues. On générlise l Riemnn intégrbilité des fonctions continues u cs des fonctions bornées continues sur [, b] suf en un nombre fini de points, comme celle de l figure A.1. Enfin nous étblissons que toute limite uniforme sur [, b] d une suite de fonctions Riemnn intégrbles sur [, b] est encore Riemnn intégrble. Ceci nous donne notmment l Riemnn intégrbilité de toutes les fonction réglées, i.e. limites uniformes de fonctions en esclier. Les fonctions en escliers sont les plus simples de toutes les fonctions Riemnn intégrbles et c est pr elles que nous commençons cette étude. Définition A.7 (fonction en esclier). Une ppliction f : [, b] R est ppelée fonction en esclier sur [, b], s il existe une subdivision = {t = < t 1 < < t j = b} telle que f soit constnte sur chque intervlle ouvert ]t i 1, t i [, i = 1,..., j. Il est clir que n est ps unique, en prticulier pour tout rffinement de, f est constnte sur chcun des intervlles ouverts ynt pour extrêmités deux points Ch. Suquet, Cours I.P.É. 21 219
Annexe A. Intégrle de Riemnn sur [, b] consécutifs de. Il y donc une infinité de subdivisions telles que f en esclier soit constnte sur chcun des intervlles ouverts de (i.e. les intervlles ynt pour extrêmités deux points consécutifs de ). Nous ppelerons subdivision ssociée à f en esclier, toute subdivision telle que f soit constnte sur chcun des intervlles ouverts de. L moins fine des subdivisions ssociées à f en esclier est constituée des points et b et des points de discontinuité de f dns ], b[. Proposition A.8 (intégrbilité d une fonction en esclier). Soit f une fonction en esclier sur [, b] et = {t = < t 1 < < t j = b} une subdivision ssociée à f, l vleur constnte de f sur ]t i 1, t i [ étnt notée c i. Alors f est Riemnn intégrble sur [, b] et on b j f(x) dx = (t i t i 1 )c i. (A.11) Remrquons que comme b f(x) dx ne dépend, lorsqu elle existe, que de f, (A.11) implique que si 1 = {s = < s 1 < < s l = b} est une utre subdivision ssociée à f et en notnt d k l vleur constnte de f sur ]s k 1, s k [, k = 1,..., l, on j (t i t i 1 )c i = i=1 i=1 l (s k s k 1 )d k. Preuve. D bord, f est bornée puisque f([, b]) = {c 1,..., c j } {f(t ),..., f(t j )} qui est fini (de crdinl u plus 2j + 1) donc borné dns R. Pour chque δ vérifint k=1 < δ < 1 2 min 1 i j (t i t i 1 ), (A.12) notons δ l subdivision construite en djoignnt à les points t + δ, t 1 δ, t 1 + δ, t 2 δ, t 2 + δ,..., t j 1 + δ, t j δ. Notons en outre m i := m := inf f(x), x [,b] M := sup f(x), x [,b] inf f(x) = min(c i, c i+1, f(t i )), M i := sup f(x) = mx(c i, c i+1, f(t i )), t i x δ t i x δ vec l dpttion évidente pour i = j. On bien sûr M i M et m i m pour tout i. Avec ces nottions on j 1 j S δ (f) = (t i t i 1 2δ)c i + δm + δm j + 2δ i=1 j (t i t i 1 )c i + 2jδ(M m). (A.13) i=1 De même vec les m i à l plce de M i on obtient S δ (f) i=1 M i j (t i t i 1 )c i 2jδ(M m). (A.14) i=1 22 Ch. Suquet, Cours I.P.É. 21
A.2. Riemnn intégrbilité Soit ε > quelconque, en choisissnt δ = δ(ε) vérifint à l fois (A.12) et 2jδ(M m) < ε, on dispose insi pr (A.13) et (A.14) d une subdivision δ(ε) telle que j (t i t i 1 )c i ε < S δ(ε) S δ(ε) < i=1 j (t i t i 1 )c i + ε. i=1 On en déduit pour tout ε > l encdrement : j (t i t i 1 )c i ε < I (f) I (f) < i=1 j (t i t i 1 )c i + ε, i=1 puis en fisnt tendre ε vers que I (f) = I (f) = j (t i t i 1 )c i, i=1 ce qui étblit l intégrbilité de f et (A.11). Proposition A.9 (intégrbilité d une fonction monotone). Si f : [, b] R est monotone sur [, b], elle est Riemnn intégrble sur [, b]. Preuve. Supposons pour fixer les idées que f est décroissnte, l dpttion de ce qui suit u cs f croissnte étnt immédite. Alors f est bornée puisque pour tout x [, b], f(b) f(x) f(). Pour = {x = < x 1 < < x n = b} subdivision quelconque de [, b], notons m k et M k les bornes inférieure et supérieure de f sur [x k 1, x k ] et remrquons que pr décroissnce de f, m k = f(x k ) et M k = f(x k 1 ). On lors S (f) S (f) = = n (x k x k 1 )(M k m k ) k=1 n (x k x k 1 ) ( f(x k 1 ) f(x k ) ) k=1 mx (x k x k 1 ) 1 k n n ( f(xk 1 ) f(x k ) ) k=1 = mx 1 k n (x k x k 1 ) ( f() f(b) ). Soit ε > quelconque. En choisissnt une subdivision de ps u plus ε, i.e. telle que mx 1 k n (x k x k 1 ) ε, on S (f) S (f) ε ( f() f(b) ). On en déduit que I (f) I (f) ε ( f() f(b) ), puis comme ε est quelconque que I (f) I (f) =. L fonction f est donc Riemnn intégrble. Ch. Suquet, Cours I.P.É. 21 221
Annexe A. Intégrle de Riemnn sur [, b] Proposition A.1 (intégrbilité d une fonction continue). Si f : [, b] R est continue, elle est Riemnn intégrble sur [, b]. De plus si F est une primitive de f sur [, b], b f(x) dx = F (b) F (). (A.15) Preuve. Sur le compct [, b], l fonction f est bornée et uniformément continue : ε >, δ >, x, x [, b], x x < δ f(x) f(x ) < ε. Pour chque ε >, on peut trouver une subdivision = {x = < x 1 < < x n = b} (dépendnt de δ) telle que pour k = 1,..., n, x k x k 1 < δ. Comme les bornes inférieure m k et supérieure M k de f sur le compct [x k 1, x k ] sont tteintes, on pour tout k M k m k < ε. On lors S (f) S (f) = n n (x k x k 1 )(M k m k ) ε (x k x k 1 ) = ε(b ). k=1 k=1 En rison de l encdrement S (f) I (f) I (f) S (f), nous vons insi étbli que ε >, I (f) I (f) ε(b ). Comme I (f) I (f) ne dépend ps de ε, on en déduit que I (f) I (f) =, d où l Riemnn intégrbilité de f sur [, b]. Rppelons que F est une primitive de f sur [, b] si elle est dérivble en tout point de [, b] (à droite en et à guche en b) et pour tout x [, b], F (x) = f(x). Soit = {x = < x 1 < < x n = b} une subdivision quelconque de [, b]. Pr le théorème des ccroissements finis 5, il existe dns chque ]x k 1, x k [ un c k tel que F (x k ) F (x k 1 ) = (x k x k 1 )F (c k ) = (x k x k 1 )f(c k ). En écrivnt F (b) F () = n ( F (xk ) F (x k 1 ) ) = k=1 n (x k x k 1 )f(c k ) k=1 et en encdrnt f(c k ) entre les bornes inférieure et supérieure de f sur [x k 1, x k ], on en déduit S (f) F (b) F () S (f). Cet encdrement est vlide pour toute subdivision et F (b) F () ne dépend ps de. Pr conséquent I (f) F (b) F () I (f) et comme nous svons déjà que f est Riemnn intégrble on en déduit F (b) F () = I (f) = I (f), ce qui étblit (A.15). 5. Appelé ussi formule des ccroissements finis : si f est continue sur [, b] et dérivble sur ], b[, il existe c ], b[ tel que f(b) f() = f (c)(b ). 222 Ch. Suquet, Cours I.P.É. 21
A.2. Riemnn intégrbilité L preuve de (A.15) s étend imméditement u cs où F est dérivble sur ], b[, continue à droite en et à guche en b et F = f sur ], b[. D utre prt on peut utiliser l intégrle de Riemnn pour montrer que toute fonction continue sur [, b] dmet des primitives sur [, b]. Proposition A.11. Toute fonction f : [, b] R, bornée sur [, b] et continue sur [, b], suf en un nombre fini de points est Riemnn intégrble sur [, b]. Preuve. Nous nous contenterons de le montrer dns le cs où f présente un seul point de discontinuité c ], b[, l générlistion ne coûtnt qu un lourdissement de nottions. L dpttion de ce qui suit u cs c = ou c = b est ussi immédite. Fixons ε > rbitrire et soit η > ssez petit pour que [c η, c + η] ], b[ et dont le choix en fonction de ε ser précisé ultérieurement. Soit une subdivision de [, b] ynt comme points consécutifs c η et c + η (i. e. x k = c η et x k +1 = c + η pour un certin indice k ). Cette subdivision peut se construire comme réunion d une subdivision quelconque 1 de [, c η] et d une subdivision quelconque 2 de [c + η, b]. Comme f est continue sur [, c η] et [c + η, b], elle est Riemnn intégrble sur chcun de ces deux segments (prop. A.1), ce qui nous utorise à choisir 1 et 2 telles que S 1 (f) S 1 (f) ε 3, S 2 (f) S 2 (f) ε 3. (A.16) Notons m et M, m η et M η les bornes inférieure et supérieure de f sur respectivement [, b] et [c η, c+η]. On clirement m m η M η M, d où 2η(M η m η ) 2η(M m), de sorte qu en choisissnt ε η < 6(M m), on it 2η(M η m η ) < ε 3. Avec le choix de opéré ci-dessus, nous vons d où compte-tenu de (A.16) et (A.17), S (f) = S 1 (f) + 2ηM η + S 2 (f) S (f) = S 1 (f) + 2ηm η + S 2 (f), S (f) S (f) S 1 (f) S 1 (f) + 2η(M η m η ) + S 2 (f) S 2 (f) < ε. (A.17) On en déduit que I (f) I (f) < ε, puis pr rbitrrité de ε que I (f) = I (f), i.e. que f est Riemnn intégrble sur [, b]. Nous llons mintennt étblir que l Riemnn intégrbilité se conserve pr convergence uniforme sur [, b]. Le lemme suivnt nous ser utile. Ch. Suquet, Cours I.P.É. 21 223
Annexe A. Intégrle de Riemnn sur [, b] Lemme A.12. Soit E une prtie quelconque de R. On suppose que chque fonction f n est définie et bornée sur E et que l suite (f n ) n 1 converge vers f uniformément sur E. Alors f est bornée sur E et m n (E) := inf f n(x) x E M n (E) := sup f n (x) x E n + n + inf f(x) =: m(e), x E f(x) =: M(E). sup x E Plus précisément, si pour tout n n ε, on pour tout x E, f n (x) f(x) < ε, lors n n ε, m n (E) m(e) ε et M n (E) M(E) ε. (A.18) Preuve. L convergence uniforme de (f n ) vers f sur E, s écrit ε >, n ε N, n n ε, x E, f n (x) f(x) < ε. (A.19) En réécrivnt cette inéglité sous l forme f n (x) ε < f(x) < f n (x) + ε on en déduit : n n ε, x E, m n (E) ε < f(x) < M n (E) + ε, puis en prennt l infimum et le supremum en x E dns cette double inéglité 6 : n n ε, m n (E) ε m(e) et M(E) M n (E) + ε. (A.2) En choisisssnt un n prticulier, pr exemple n = n ε, on en déduit que f est bornée sur E ( < m n (E) ε m(e) M(E) M n (E) + ε < + ). En réécrivnt l inéglité (A.19) sous l forme f(x) ε < f n (x) < f(x) + ε, on obtient de l même fçon : n n ε, m(e) ε m n (E) et M n (E) M(E) + ε. (A.21) En regroupnt (A.2) et (A.21), on voit insi que pour tout n n ε, m(e) ε m n (E) m(e) + ε et M(E) ε M n (E) M(E) + ε, ce qui nous donne (A.18) et donc les convergences de m n (E) et M n (E) vers respectivement m(e) et M(E) puisque ε > est ici rbitrire. Proposition A.13. Si f est limite uniforme sur [, b] d une suite (f n ) n 1 de fonctions Riemnn intégrbles sur [, b], lors f est elle-même Riemnn intégrble sur [, b]. Preuve. D bord, f est bornée sur [, b] comme limite uniforme d une suite de fonctions bornées (lemme A.12 vec E = [, b]). On peut donc bien définir les sommes de Drboux S (f) et S (f) pour toute subdivision de [, b]. Notons qu il y une difficulté supplémentire dns cette démonstrtion pr rpport ux preuves de l Riemnn intégrbilité des fonctions monotones ou continues. Dns 6. Noter ici le pssge des inéglités strictes ux inéglité lrges. 224 Ch. Suquet, Cours I.P.É. 21
A.2. Riemnn intégrbilité ces deux cs, f tteignit ses bornes inférieure et supérieure sur chque intervlle de l subdivision, ce qui fcilitit le tritement des sommes de Drboux. Ici, nous n vons plus ce confort et c est le lemme A.12 qui rrnge les choses. Pr convergence uniforme de f n vers f sur [, b], pour tout ε >, il existe un entier n ε tel que n n ε, x [, b], f n (x) f(x) < ε b. En ppliqunt le lemme A.12, on lors vec le même n ε, n n ε, E [, b], m n (E) m(e) ε b, M n(e) M(E) ε b. (A.22) Soit = {x = < x 1 < < x j = b} une subdivision quelconque de [, b]. En ppliqunt (A.22) vec pour E chcun des intervlles [x k 1, x k ] de l subdivision, on vérifie imméditement que :, n n ε, S (f n ) ε S (f) S (f) S (f n ) + ε. (A.23) L fonction f nε étnt pr hypothèse Riemnn intégrble sur [, b], il existe une subdivision ε telle que S ε (f nε ) > S ε (f nε ) ε. (A.24) En choisissnt dns (A.23) n = n ε et = ε et en combinnt l encdrement insi obtenu vec l inéglité (A.24), il vient : S ε (f nε ) 2ε < S ε (f) S ε (f) S ε (f nε ) + ε, d où l on tire S ε (f) S ε (f) < 3ε, puis I (f) I (f) < 3ε. Pr rbitrrité de ε, on en déduit I (f) = I (f), ce qui étblit l Riemnn intégrbilité de f. Définition A.14 (fonction réglée). On dit que f est réglée sur [, b] si elle est limite uniforme sur [, b] d une suite de fonctions en esclier. Corollire A.15 (intégrbilité d une fonction réglée). Toute fonction réglée [, b] R est Riemnn intégrble sur [, b]. Preuve. C est une conséquence immédite des propositions A.8 et A.13. Pour finir cette section, nous donnons un exemple de fonction Riemnn intégrble qui ne soit ps réglée (les fonctions monotones ou continues sont toutes réglées, exercice!) et un exemple de fonction bornée et borélienne qui ne soit ps Riemnn intégrble. Exemple A.16 (une fonction intégrble non réglée). Soit E := {2 k ; k N } et f := 1 E. L fonction f est bornée et Riemnn intégrble sur [, 1], mis ps réglée. Vérifions ces deux ffirmtions. Soit n := {, 2 n } {2 k ± 2 2n ; 1 k < n}. On voit imméditement que pour tout n 2 : = S n (f) I (f) I (f) S n (f) = 2 n + 2(n 1)2 2n. Ch. Suquet, Cours I.P.É. 21 225
Annexe A. Intégrle de Riemnn sur [, b] En fisnt tendre n vers +, on en déduit que I (f) = I (f) =, ce qui prouve que f est Riemnn intégrble sur [, 1] et que 1 f(x) dx =. Notons u pssge qu on insi un exemple de fonction f positive d intégrle de Riemnn nulle sur [, 1] sns que f soit identiquement nulle sur [, 1]. Cette sitution ne pourrit ps se produire vec une f continue (exercice). Supposons que f = 1 E soit réglée. Ceci implique que pour tout ε >, il existe une fonction en esclier g telle que f(x) g(x) < ε pour tout x [, 1]. Prenons ε = 1/3, choisissons une telle g, notons = {x = < x 1 < < x j = 1} une subdivision ssociée à g (cf. l définition A.7) et c 1 l vleur constnte de g sur ], x 1 [. Comme f prend u moins une fois l vleur 1 (en fit une infinité de fois) sur ], x 1 [, on 1 c 1 < 1/3 et de même f prennt u moins une fois l vleur (en fit une infinité de fois) sur ], x 1 [, on c 1 < 1/3. Ces deux inéglités sont incomptibles, donc f ne peut ps être réglée. Exemple A.17 (une fonction bornée non intégrble). Soit E := [, 1] Q et f := 1 E. L fonction f est bornée et borélienne (comme indictrice d un ensemble borélien de R), mis n est ps Riemnn intégrble sur [, 1]. En effet en notnt que dns tout intervlle ouvert non vide de R il y u moins un rtionnel et un irrtionnel, on vérifie fcilement que pour toute subdivision de [, 1], S (f) = et S (f) = 1. On en déduit que I (f) = et I (f) = 1, donc f n est ps Riemnn intégrble sur [, 1]. A.3 Propriétés de l intégrle de Riemnn Cette section regroupe les propriétés générles de l intégrle de Riemnn, à l exception de celles reltives à l interversion limite intégrle. Nous étudions d bord les propriétés reltives ux fonctions à intégrer (les intégrndes), utrement dit l structure de l ensemble R[, b]. Nous verrons ensuite les propriétés concernnt l intervlle d intégrtion. A.3.1 Propriétés de l ensemble R[, b] Proposition A.18 (dditivité). Si f et g sont Riemnn intégrbles sur [, b], f +g l est ussi et b (f + g)(x) dx = b f(x) dx + b g(x) dx. (A.25) Preuve. Notons en préliminire que si f et g sont bornées sur l intervlle I, f + g l est ussi et on inf f(x) + inf x I x I g(x) inf(f + g)(x), sup x I x I (f + g)(x) sup x I f(x) + sup g(x), x I 226 Ch. Suquet, Cours I.P.É. 21
A.3. Propriétés de l intégrle de Riemnn ces inéglités pouvnt être strictes 7. Fixons ε > quelconque. L Riemnn intégrbilité de f et g nous fournissent des subdivisions 1 et 2 telles que b f(x) dx ε < S 1 (f) S 1 (f) < b f(x) dx + ε et b g(x) dx ε < S 2 (g) S 2 (g) < b g(x) dx + ε. Avec leur rffinement commun := 1 2, on insi : b b f(x) dx ε < S (f) S (f) < g(x) dx ε < S (g) S (g) < b b f(x) dx + ε, g(x) dx + ε. (A.26) (A.27) Notons x i, i n les points de, m i, m i, m i, M i, M i, M i les infim et suprem respectifs de f + g, f et g sur [x i 1, x i ] pour i = 1,..., n. Pr l remrque fite en préliminire, on pour tout i = 1,..., n, On en déduit que m i + m i m i M i M i + M i. S (f) + S (g) S (f + g) S (f + g) S (f) + S (g). (A.28) En combinnt (A.26), (A.27) et (A.28), on obtient b d où b f(x) dx + f(x) dx + b b g(x) dx 2ε < S (f + g) S (f + g) < g(x) dx 2ε < I (f + g) I (f + g) < b b f(x) dx + f(x) dx + b b g(x) dx + 2ε, g(x) dx + 2ε. Ce dernier encdrement étnt vérifié pour tout ε >, on peut y fire tendre ε vers pour obtenir finlement I (f + g) = I (f + g) = b ce qui étblit l intégrbilité de f + g et (A.25). f(x) dx + b g(x) dx, Proposition A.19. Si f est intégrble sur [, b] et c R est une constnte, cf est intégrble sur [, b] et b cf(x) dx = c b 7. Pr exemple f : x x et g : x 1 x sur I = [, 1]. f(x) dx. (A.29) Ch. Suquet, Cours I.P.É. 21 227
Annexe A. Intégrle de Riemnn sur [, b] Preuve. Le résultt est trivil si c =, puisqu lors cf est l fonction identiquement nulle sur [, b], Riemnn intégrble d intégrle. Supposons c. Si f est bornée sur l ensemble E, cf est bornée sur E. On vérifie fcilement que et que si c >, si c <, inf (cf)(x) = c inf f(x), x E x E inf x E (cf)(x) = c sup f(x), x E sup x E (cf)(x) = c sup f(x), x E sup(cf)(x) = c inf f(x). x E x E Pour c >, on déduit de (A.3) que pour toute subdivision de [, b], (A.3) (A.31) S (cf) = cs (f), S (cf) = cs (f), d où I (cf) = ci (f) et I (cf) = ci (f). Ces deux églités sont vlbles pour n importe quelle fonction bornée f sur [, b]. Ici f est de plus intégrble sur [, b], donc I (f) = I (f) = b f(x) dx, d où I (cf) = I (cf) = c b f(x) dx, ce qui prouve l intégrbilité de cf et étblit (A.29). Pour c <, on déduit de (A.31) que pour toute subdivision de [, b], S (cf) = cs (f), S (cf) = cs (f), d où I (cf) = ci (f) et I (cf) = ci (f). Pr intégrbilité de f, on en déduit comme ci-dessus que I (cf) = I (cf) = c b f(x) dx, ce qui complète l preuve. On peut synthétiser les propositions A.18 et A.19 dns l énoncé suivnt. Proposition A.2 (linérité). L ensemble R[, b] des pplictions f : [, b] R, Riemnn intégrbles sur [, b] est un R-espce vectoriel et l ppliction Ψ : R[, b] R, f b f(x) dx est une forme linéire sur cet espce. Proposition A.21 (croissnce de l intégrle). L intégrle de Riemnn sur [, b] possède les trois propriétés suivntes reltivement à l reltion d ordre prtiel définie sur R[, b] pr f g si x [, b], f(x) g(x). i) Positivité : si f R[, b] et f sur [, b], b f(x) dx. (A.32) ii) Croissnce : si f, g R[, b] et f g sur [, b], b f(x) dx b g(x) dx. (A.33) iii) Si f R[, b], l ppliction f : x f(x) est elle ussi Riemnn intégrble sur [, b] et b b f(x) dx f(x) dx. (A.34) 228 Ch. Suquet, Cours I.P.É. 21
A.3. Propriétés de l intégrle de Riemnn Preuve. Rppelons que lorsqu on prle d intégrle sur [, b], on suppose implicitement b. Dns le cs > b, on urit b f(x) dx dns (A.32) et b g(x) dx b f(x) dx dns (A.33). Pour prouver i), on remrque que si f sur [, b] et est une subdivision (croissnte) quelconque de [, b], on m k pour chque intervlle [x k 1, x k ] de, donc S (f) et pr conséquent I (f) I (f). Ce risonnement est vlble pour toute f positive bornée sur [, b]. Comme ici f est de plus Riemnn intégrble sur [, b], I (f) = I (f) = b f(x) dx et (A.32) est vérifiée. On vérifie ii) en notnt que si f, g sont dns R[, b], h := g f ussi (prop. A.2) et h. En utilisnt i) et l proposition A.2, on obtient b h(x) dx = b g(x) dx b f(x) dx, ce qui nous donne (A.33). Admettons un instnt que l intégrbilité de f implique celle de f. En ppliqunt ii) vec l encdrement f f f, il vient 8 : b f(x) dx b f(x) dx b f(x) dx, ce qui équivut à (A.34). Il reste à montrer que f hérite de l intégrbilité de f. Pour toute subdivision = {x = < x 1 < <x n = b}, notons m k := M k := inf f(x), m k := inf f(x), x [x k 1,x k ] x [x k 1,x k ] sup f(x), M k := sup f(x). x [x k 1,x k ] x [x k 1,x k ] Pr le lemme A.22 ci-dessous, on pour tout k = 1,..., n, M k m k M k m k, d où I ( f ) I ( f ) S ( f ) S ( f ) S (f) S (f) Comme f est Riemnn intégrble sur [, b], on peut choisir pour tout ε une subdivision telle que S (f) S (f) < ε et l encdrement ci-dessus ppliqué à cette subdivision nous donne I ( f ) I ( f ) < ε, d où I ( f ) = I ( f ) pr rbitrrité de ε. Lemme A.22. Si f est bornée sur E R, lors f est bornée sur E et en notnt m := inf E f, m := inf E f, M := sup E f, M := sup E f, on M m M m, l inéglité pouvnt être stricte. Preuve. Si M m =, c est trivil 9. Supposons désormis que M m >. Alors pour tout ε tel que < ε < (M m )/2, on peut trouver x 1, x 2 E, dépendnts de ε, tels que : m f(x 1 ) < m + ε < M ε < f(x 2 ) M. (A.35) 8. En utilisnt ussi b f(x) dx = b f(x) dx pr linérité. 9. Cette sitution peut se produire, pr exemple E = [ 1, 1] et f(x) = 1 [ 1,] (x) 1 ],1] (x), on dns ce cs = M m < M m = 2. Ch. Suquet, Cours I.P.É. 21 229
Annexe A. Intégrle de Riemnn sur [, b] Pr inéglité tringulire, f(x 2 ) f(x 1 ) f(x 2 ) f(x 1 ). D utre prt f(x 1 ) et f(x 2 ) sont des réels du segment [m, M], d où f(x 2 ) f(x 1 ) M m et donc f(x 2 ) f(x 1 ) M m. En combinnt cette dernière inéglité vec (A.35), il vient : M m 2ε M m. Fisnt tendre ε vers dns cette inéglité lrge, on obtient M m M m. Remrque A.23. L Riemnn intégrbilité de f n implique ps celle de f. Voici un contre exemple vec [, b] = [, 1], f(x) = 1 si x Q et 1 si x / Q. Alors, comme dns l exemple A.17, f n est ps Riemnn intégrble sur [, 1], tndis que f l est (comme fonction constnte). Voici une conséquence immédite de l impliction f R[, b] f R[, b] dns l proposition A.21 iii). Corollire A.24. Si f est Riemnn intégrble sur [, b], les fonctions f + := mx(f, ) et f := mx( f, ) = min(f, ) le sont ussi. On de plus b f(x) dx = b f + (x) dx b f (x) dx. (A.36) Preuve. On commence pr remrquer que f + = 1 ( f + f), 2 f = 1 ( f f). 2 Pr l proposition A.21 iii) l intégrbilité de f implique celle de f. L ensemble R[, b] étnt un espce vectoriel (prop. A.2), on en déduit l Riemnn intégrbilité sur [, b] de f + et f. L linérité de l intégrle et l églité f = f + f nous donnent (A.36). Remrque A.25 (semi norme sur R[, b]). Grâce u point iii) de l proposition A.21, on peut définir l ppliction N : R[, b] R +, f N(f) := b f(x) dx. Cette ppliction est une semi norme sur R[, b] cr elle vérifie N(cf) = c N(f) pour toute constnte c et N(f + g) N(f) + N(g). Elle n est ps une norme cr on peut voir b f(x) dx = sns que f soit l fonction nulle sur [, b], voir l exemple A.16. Proposition A.26 (Intégrbilité d un produit). Si f et g sont Riemnn intégrbles sur [, b], leur produit fg l est ussi. 23 Ch. Suquet, Cours I.P.É. 21
A.3. Propriétés de l intégrle de Riemnn Preuve. En écrivnt fg = (f + f )(g + g ) = f + g + f g + f + g + f g et en utilisnt le corollire A.24 et l linérité de l intégrle de Riemnn, on voit qu il suffit de triter le cs où f et g sont toutes deux positives sur [, b]. Fixons ε > quelconque. L Riemnn intégrbilité de f et g nous fournissent des subdivisions 1 et 2 telles que b f(x) dx ε < S 1 (f) S 1 (f) < b f(x) dx + ε et b g(x) dx ε < S 2 (g) S 2 (g) < b g(x) dx + ε. Avec leur rffinement commun := 1 2, on insi : S (f) S (f) 2ε, (A.37) S (g) S (g) 2ε. (A.38) Rppelons ici que f et g Riemnn intégrbles sur [, b] sont ipso fcto bornées sur cet intervlle, donc fg est ussi bornée sur [, b]. Notons x i, i n les points de, m i, m i, m i, M i, M i, M i les infim et suprem respectifs de fg, f et g sur [x i 1, x i ] pour i = 1,..., n. Pr positivité on pour tout i = 1,..., n, d où x [x i 1, x i ], m im i f(x)g(x) M im i, m im i m i M i M im i. Notons c un mjornt commun sur [, b] ux fonctions positives bornées f et g. On lors on pour tout i = 1,..., n, M i m i M im i m im i = (M i m i)m i + m i(m i m i ) c(m i m i) + c(m i m i ). En reportnt cette mjortion dns le clcul de S (fg) S (fg) et en tennt compte de (A.37) et (A.38), on obtient S (fg) S (fg) 4cε. Comme ε étit rbitrire, on en déduit l Riemnn intégrbilité de fg. Contrirement à ce qui se psse pour l Riemnn intégrbilité d une somme f + g, il n y ps de formule permettnt de clculer b f(x)g(x) dx en fonction de b f(x) dx et b g(x) dx. L formule «b f(x)g(x) dx = b f(x) dx b g(x) dx» est grossièrement fusse. Voici un contre exemple élémentire vec des fonctions en esclier. Prenons =, b = 2, f = 1 [,1], g = 1 ]1,2]. Alors fg est l fonction nulle sur [, 2] et donc 2 f(x)g(x) dx =, lors que 2 f(x) dx 2 g(x) dx = 1 prce que 2 f(x) dx et 2 g(x) dx vlent chcune 1. Proposition A.27 (inéglité de Cuchy-Schwrz dns R[, b]). Si f et g sont Riemnn intégrbles sur [, b], on l inéglité b { b f(x)g(x) dx } 1/2 { b 1/2 f(x) 2 dx g(x) dx} 2. (A.39) Ch. Suquet, Cours I.P.É. 21 231
Annexe A. Intégrle de Riemnn sur [, b] Preuve. Soit t un réel quelconque. Pr les propositions A.2 et A.26, les fonctions f 2, g 2, fg et (tf + g) 2 héritent de l Riemnn intégrbilité de f et g. Posons P (t) := b ( tf(x) + g(x) ) 2 dx. Il est clir que P (t) est positif ou nul pour tout t réel. Or en développnt le crré (tf +g) 2 et en utilisnt l linérité de l intégrle, on obtient { b } { b } b P (t) = f(x) 2 dx t 2 + 2 f(x)g(x) dx t + g(x) 2 dx. On reconnît là un trinôme du second degré At 2 +Bt+C dont les coefficients A, B, C sont des intégrles. Ce trinôme ne peut voir de signe constnt, celui de A = b f(x)2 dx, que si son discriminnt = B 2 4AC est négtif ou nul. Remplçnt A, B et C pr leurs expressions sous forme d intégrles, on en déduit (A.39). A.3.2 Propriétés reltives à l intervlle d intégrtion L intégrle de Riemnn se lisse volontiers découper en morceux. Voici les énoncés précis dont l vérifiction est lissée u lecteur. Proposition A.28 (dditivité reltive ux intervlles). Soit f : [, b] R et c ], b[. Pour que f soit Riemnn intégrble sur [, b], il fut et il suffit qu elle soit Riemnn intégrble sur [, c] et sur [c, b]. On lors b f(x) dx = c f(x) dx + b c f(x) dx. (A.4) En combinnt l proposition A.28 vec l définition A.2, on obtient l formule clssique suivnte. Proposition A.29 (reltion de Chsles). Pour tous réels, b, c, on b f(x) dx = c f(x) dx + b c f(x) dx, pourvu que f soit Riemnn intégrble sur [min(, b, c), mx(, b, c)]. Une utre ppliction de l dditivité reltive ux intervlles est l générlistion de l formule (A.1) pour le clcul de l ire du domine H délimité pr le grphe de f, l xe des bscisses et les deux droites verticles d équtions x = et x = b, voir figure A.6. Plus précisément, H est défini pr H := {(x, y) R 2 ; x b et f (x) y f + (x)}, (A.41) en notnt que f (x) = f(x) ou selon que f(x) < ou non et que f + (x) = f(x) ou selon que f(x) > ou non. En combinnt l proposition A.5, l remrque A.6, l dditivité reltive ux intervlles de l intégrle de Riemnn et l dditivité finie de λ 2, on obtient le résultt suivnt pour les fonctions n ynt qu un nombre fini de chngements de signe sur [, b]. 232 Ch. Suquet, Cours I.P.É. 21
A.3. Propriétés de l intégrle de Riemnn y H 1 H 2 H 3 H 4 b x Fig. A.6 Domine H délimité pr f entre et b Proposition A.3. Soit f une fonction borélienne sur [, b] et Riemnn intégrble sur [, b]. On suppose qu il existe une subdivision x = < x 1 < < x n = b telle que le signe de f soit constnt sur chcun des [x i 1, x i ], 1 i n. Alors l ire du domine H défini pr (A.41) est donnée pr λ 2 (H) = b f(x) dx. (A.42) Dns cet énoncé, «signe constnt» s entend u sens lrge : ou bien f(x) pour tout x [x i 1, x i ] ou bien f(x) pour tout x [x i 1, x i ]. L hypothèse f borélienne ssure que s restriction à chcun des [x i 1, x i ] est encore borélienne (pour les tribus déqutes) et donc que chque H i := {(x, y) R 2 ; x i 1 x x i et f (x) y f + (x)} est un borélien de R 2 (dmis). Bien entendu en écrivnt cet énoncé, on en tête le cs où le signe de f chnge à l trversée de chque x i, < i < n, mis l formule (A.42) reste évidemment vrie sns cette hypothèse. Si f le même signe sur deux intervlles consécutifs, on peut trouver une subdivision «plus économique» en les fusionnnt. Nous pouvons mintennt donner une interpréttion géométrique de l intégle de Riemnn, u moins pour les fonctions f vérifint les hypothèses de l proposition A.3. Pour cel on ppelle «ire lgébrique», l somme des λ 2 (H i ), chcun étnt compté vec le signe de f sur l intervlle correspondnt. L ire lgébrique du domine H représenté à l figure A.6 vut insi λ 2 (H 1 ) λ 2 (H 2 ) + λ 2 (H 3 ) λ 2 (H 4 ). Plus formellement, posons +1 si f(t) > pour u moins un t ]x i 1, x i [, s i := 1 si f(t) < pour u moins un t ]x i 1, x i [, si f(t) = pour tout t ]x i 1, x i [. L rgumenttion esquissée pour l proposition A.3 nous donne n b ire lgébrique(h) := s i λ 2 (H i ) = f(x) dx. i=1 (A.43) Ch. Suquet, Cours I.P.É. 21 233
Annexe A. Intégrle de Riemnn sur [, b] Nous regroupons dns le théorème suivnt les propriétés de «l intégrle indéfinie», c est à dire de l fonction x x f(t) dt. Théorème A.31. Soit f Riemnn intégrble sur [, b]. Alors elle est ussi Riemnn intégrble sur [, x] pour tout x [, b], ce qui permet de définir l ppliction F : [, b] R pr F (x) := x f(t) dt. i) F est continue sur [, b] et même lipschitzienne. ii) Si f une limite l u point c de [, b] (resp. une limite à droite, resp. à guche), F est dérivble u point c (resp. à guche, resp. à droite) et F (c) = l. iii) Si f est continue sur [, b], F est dérivble sur [, b] et pour fonction dérivée f. C est l unique primitive de f sur [, b] qui s nnule u point. Preuve de i). Notons C := sup t [,b] f(t). En utilisnt l reltion de Chsles et l proposition A.21, on pour tous x y b, y y y F (y) F (x) = f(t) dt f(t) dt C dt = C y x. x Ceci montre que F est lipschitzienne de rpport C sur [, b], donc fortiori continue. Preuve de ii). Commençons pr noter que pour tout x c dns [, b], x x F (x) F (c) x c = 1 x c x Comme f pour limite l u point c, on : c f(t) dt, et l = 1 x c x c l dt. ε >, δ >, t c x c < δ f(t) l < ε. (A.44) (A.45) En combinnt (A.44) et (A.45), on voit que pour tout x [, b] vérifint x c < δ, F (x) F (c) 1 x l = (f(t) l) dt 1 x f(t) l dt ε, x c x c x c c ce qui montre que F est dérivble u point c, de nombre dérivé F (c) = l. L dpttion u cs d une limite à droite ou à guche (vec dérivée à droite ou à guche) est immédite. c Preuve de iii). Si f est continue sur [, b], elle pour limite f(c) en tout point c de [, b] et donc d près ii), F est dérivble sur [, b] et F (c) = f(c). Cette dernière églité ynt lieu mintennt pour tout c [, b], on F = f, utrement dit F est une primitive de f sur [, b]. On sit que toutes les primitives de f sur l intervlle [, b] diffèrent entre elles d une constnte 1 Il y en donc une seule qui s nnule u point, c est F. 1. C est une conséquence de l formule des ccroissements finis (cf. p.222) : si une fonction continue sur [, b] une dérivée nulle sur ], b[, elle est constnte sur [, b] et on pplique ceci à l différence de deux primitives quelconques de f sur [, b]. 234 Ch. Suquet, Cours I.P.É. 21
A.3. Propriétés de l intégrle de Riemnn Proposition A.32 (chngement de vrible). i) Trnsltion. Soit c R. Pour toute f Riemnn intégrble sur [ + c, b + c], l ppliction g : [, b] R, x f(x + c) est Riemnn intégrble sur [, b] et b f(x + c) dx = b+c +c f(y) dy. (A.46) ii) Chngement d échelle. Soit c R. Pour toute f Riemnn intégrble sur l intervlle fermé d extrêmités 11 c et bc, l ppliction h : [, b] R, x f(cx) est Riemnn intégrble sur [, b] et b f(cx) dx = 1 c bc c f(y) dy. (A.47) iii) Clssique. Soit ϕ : [, b] R, une fonction ynt une dérivée continue sur [, b] (utrement dit ϕ C 1 [, b]). Pour toute fonction f continue sur l intervlle fermé borné ϕ([, b]), on b f ( ϕ(x) ) ϕ (x) dx = ϕ(b) ϕ() f(y) dy. (A.48) Bien sûr i) et ii) sont contenus dns iii) si f est continue, mis l intérêt de ces deux énoncés séprés est qu ils sont vlbles vec n importe quelle fonction f Riemnn intégrble. Preuve de i). À chque subdivision = {x = < x 1 < < x n = b} de [, b], ssocions l subdivision trnsltée = {y = + c < < y k = x k + c < < y n = b + c}. Comme f est bornée sur [ + c, b + c], g est bornée sur [, b] vec mêmes bornes. De plus en notnt m k, m k les infim respectifs de f sur [x k 1, x k ] et de g sur [y k 1, y k ], et en définissnt de même M k et M k pour les suprem, on m k = m k et M k = M k pour k = 1,..., n. Pr conséquent S (g) = S (f) et S (g) = S (f), pour toute subdivision de [, b]. Comme l trnsformtion rélise une bijection entre l ensemble des subdivisions de [, b] et l ensemble des subdivisions de [ + c, b + c], on en déduit que et de même I (g) = inf S (g) = inf S (f) = I (f) (A.49) I (g) = sup S (g) = sup S (f) = I (f). (A.5) Comme on sit de plus que f est Riemnn intégrble sur [+c, b+c], on I (f) = I (f). Compte-tenu de (A.49) (A.5), on en déduit I (g) = I (g) = I (f) = b+c f(y) dy, ce +c qui nous donne l Riemnn intégrbilité de g sur [, b] et l églité (A.46). 11. Il s git de [c, bc] si c > et de [bc, c] si c <. Ch. Suquet, Cours I.P.É. 21 235
Annexe A. Intégrle de Riemnn sur [, b] Preuve de ii). L méthode étnt essentiellement l même que pour le i), nous nous contenterons d indiquer les dpttions nécessires. Si c >, on ssocie à = {x = < x 1 < < x n = b} l subdivision dont les points sont les y k = cx k. Alors est une subdivision croissnte de [c, bc] et comme y k y k 1 = c(x k x k 1 ), on voit que S (h) = 1S c (f) et S (h) = 1 c S (f). On en déduit comme ci-dessus l intégrbilité de h et (A.47). Si c <, bc c et on prend pour subdivision croissnte ssociée à l subdivision de [bc, c] ynt pour points les y k = cx n k. Alors pour k = 1,..., n, y k y k 1 = c(x n k x n k+1 ) = c(x n k+1 x n k ). On en déduit que S (h) = 1S c (f) et S (h) = 1 c S (f) puis, que h est Riemnn intégrble et b en utilisnt l définition A.2. h(x) dx = 1 c c bc f(y) dy = 1 c bc c f(y) dy, Preuve de iii). D bord, ϕ étnt continue, l imge J de [, b] pr ϕ est un intervlle (théorème des vleurs intermédiires) et comme [, b] est compct, J = ϕ([, b]) est ussi compct (l imge d un compct pr une ppliction continue est un compct). Ainsi J est un intervlle compct, donc un intervlle fermé borné. Cet intervlle contient évidemment l intervlle I d extrêmités ϕ() et ϕ(b) (ps forcément dns cet ordre), l inclusion pouvnt être stricte. L fonction f étnt continue sur J l est ussi pr restriction sur I et l intégrle u second membre de (A.48) est donc bien définie. L intégrle du premier membre l est tout utnt puisque (f ϕ)ϕ est continue sur [, b]. Introduisons les fonctions F, G, H suivntes : F : J R, s s ϕ() f(y) dy, G : [, b] R, s s f ( ϕ(x) ) ϕ (x) dx, H := F ϕ. Pr le théorème A.31, F est dérivble sur J et F = f. De même G est dérivble sur [, b] et G = (f ϕ)ϕ. D utre prt H est dérivble comme fonction composée et H = (F ϕ)ϕ = (f ϕ)ϕ = G. Les fonctions H et G ont insi même dérivée sur [, b], leur différence est donc constnte sur [, b]. Or H() = et G() =, donc H = G. En prticulier, H(b) = G(b), ce qui étblit (A.48). Voici mintennt une version moins «clssique» du chngement de vrible. Proposition A.33 (chngement de vrible). est Riemnn intégrble sur ϕ([, b]), Si ϕ est C 1 et monotone sur [, b] et f b f ( ϕ(x) ) ϕ (x) dx = ϕ(b) ϕ() f(y) dy. (A.51) 236 Ch. Suquet, Cours I.P.É. 21
A.3. Propriétés de l intégrle de Riemnn L différence vec le chngement de vrible «clssique» (Proposition A.32 iii) est qu on ne suppose plus f continue. On pie cette plus grnde générlité pour f vec une hypothèse plus restrictive de monotonie pour ϕ. Comme cs prticuliers, on retrouve les points i) et ii) de l proposition A.32. Preuve. Notons d bord que l existence de l intégrle u second membre de (A.51) fit prtie des hypothèses, mis que celle de l intégrle du premier membre reste à étblir. Pour lléger les écritures, convenons que les nottions I, I, I, S, S, sont reltives ux bornes ϕ() et ϕ(b) lorsqu elles s ppliquent à f et reltives ux bornes et b lorsqu elles s ppliquent à (f ϕ)ϕ. Nous détillons l preuve dns le cs où ϕ est croissnte, lissnt u lecteur l dpttion u cs où f décroît. Il suffit de démontrer (A.51) pour f positive sur [ϕ(), ϕ(b)]. En effet (A.51) est clirement vérifiée si on remplce f pr une fonction constnte c et comme f est bornée inférieurement sur [ϕ(), ϕ(b)] cr Riemnn intégrble, on peut toujours trouver c telle que g = f + c soit une fonction Riemnn intégrble positive. Si on rrive à démontrer (A.51) pour g, lors on en déduit fcilement l même églité pour f pr soustrction. Désormis, nous supposons donc sns perte de générlité que f est positive. Fixons un ε > rbitrire. Comme f est Riemnn intégrble sur [ϕ(), ϕ(b)], il existe une subdivision telle que = {y = ϕ() < y 1 < < y n = ϕ(b)} I(f) ε < S (f) = n (y k y k 1 )m k S (f) = k=1 n (y k y k 1 )M k < I(f) + ε. k=1 Rppelons que m k = inf{f(y); y [y k 1, y k ]} et M k = sup{f(y); y [y k 1, y k ]}. Comme ϕ est croissnte et continue, l imge de [, b] pr ϕ est le segment [ϕ(), ϕ(b)] et ϕ est une surjection 12 de [, b] sur [ϕ(), ϕ(b)]. On peut donc trouver pour chque y k u moins un ntécédent x k pr ϕ et quelque soit le choix de cet ntécédent, on ur nécessirement x k 1 < x k cr y k 1 est strictement inférieur à y k et ϕ est croissnte u sens lrge. L fonction ϕ étnt continue sur le compct [, b] est uniformément continue sur cet intervlle. On peut donc subdiviser chque [x k 1, x k ] en x k, = x k 1 < < x k,jk = x k de sorte qu en notnt pour j =,..., j k, m k,j = inf{ϕ (x); x [x k,j 1, x k,j ]} et M k,j = sup{ϕ (x); x [x k,j 1, x k,j ]}, on it : M k,j m k,j < ε M(b ) =: ε, où M := sup f. [ϕ(),ϕ(b)] 12. Elle n est ps forcément injective cr on n ps supposé l croissnce stricte. Ch. Suquet, Cours I.P.É. 21 237
Annexe A. Intégrle de Riemnn sur [, b] En retennt de cette inéglité que m k,j > M k,j ε, on en déduit l minortion suivnte : y k y k 1 = xk ϕ (x) dx = x k 1 j k xk,j j=1 j k j=1 j k j=1 x k,j 1 ϕ (x) dx m k,j(x k,j x k,j 1 ) (M k,j ε )(x k,j x k,j 1 ), d où en remrqunt que M k hérite de l positivité de f, M k (y k y k 1 ) j k j=1 M k M k,j(x k,j x k,j 1 ) ε M k (x k x k 1 ). En notnt M k,j le supremum de f ϕ sur [x k,j 1, x k,j ], on M k M k,j M k,j M k,j sup (f ϕ)ϕ. [x k,j 1,x k,j ] Finlement en désignnt pr l subdivision de [, b] formée pr tous les x k,j, k = 1,..., n, j =,..., j k, on boutit à S (f) S ( (f ϕ)ϕ ) ε I ( (f ϕ)ϕ ) ε. Comme ce dernier minornt ne dépend ps de, on en déduit que I(f) I ( (f ϕ)ϕ ) ε. Enfin, comme ε est rbitrire, il vient I(f) I ( (f ϕ)ϕ ). On lisse le soin u lecteur d dpter l rgumenttion ci-dessus pour montrer de même que I(f) I ( (f ϕ)ϕ ) + ε, puis I(f) I ( (f ϕ)ϕ ). En rssemblnt ces inéglités et en se souvennt que I I, on en déduit que I(f) = I ( (f ϕ)ϕ ) = I ( (f ϕ)ϕ ), ce qui prouve (A.51) en étblissnt u pssge l Riemnn intégrbilité de (f ϕ)ϕ. A.4 Interversion limite intégrle Théorème A.34. Soit (f n ) n 1 une suite de fonctions Riemnn intégrbles sur [, b]. On suppose que cette suite converge uniformément vers f sur [, b]. Alors f est Riemnn intégrble sur [, b] et on b f n (t) dt n + b f(t) dt. (A.52) 238 Ch. Suquet, Cours I.P.É. 21
A.4. Interversion limite intégrle Preuve. Dns l preuve de ce théorème l prtie difficile est d étblir l Riemnn intégrbilité de f, mis nous l vons déjà vue pr l proposition A.13. Une fois que l on sit que f est Riemnn intégrble, on peut écrire : b b b n N, f(t) dt f n (t) dt f(t) f n (t) dt. (A.53) Pr convergence uniforme, on pour tout ε > un entier n ε tel que n n ε, t [, b], f(t) f n (t) = f f n (t) < ε b. En reportnt cette inéglité dns (A.53), en utilisnt l linérité de l intégrle et l proposition A.21 iii), on en déduit que pour tout n n ε, b b b b b ε f(t) dt f n (t) dt = (f f n )(t) dt f f n (t) dt dt = ε. b Ceci étnt vlble pour tout ε >, l convergence (A.52) est étblie. Théorème A.35. Soit (f n ) n 1 une suite de fonctions toutes décroissntes sur [, b]. On suppose de plus que : t [, b], f n (t) f(t) R. n + Alors l fonction f insi définie est Riemnn intégrble sur [, b] et b f n (t) dt n + b f(t) dt. Il est clir que le théorème reste vri si toutes les f n d indice n n sont décroissntes ou si elles sont croissntes pour tout n n. Attention à ne ps confondre «suite de fonctions décroissntes sur [, b]» vec «suite décroissnte de fonctions définies sur [, b]». Ici on est dns le premier cs et on ne suppose rien sur le sens de vrition des suites de réels ( f n (t) ), t [, b]. n 1 Preuve. Remrquons d bord que l fonction limite f est décroissnte sur [, b] comme limite d une suite de fonctions décroissntes puisque le pssge à l limite conserve les inéglités lrges. Pr l proposition A.9, f est donc elle ussi Riemnn intégrble. Cette Riemnn intégrbilité de f nous ssure de l existence pour ε > rbitrire fixé d une subdivision = {t = < t 1 < < t j = b} telle que S (f) ε < b f(t) dt < S (f) + ε. (A.54) Notons que pr décroissnce de f et de f n, ces fonctions tteignent sur [t k 1, t k ] leur supremum u point t k 1 et leur infimum 13 u point t k. On peut donc expliciter comme suit pour f et f n les sommes de Drboux supérieures j j S (f) = f(t k 1 )(t k t k 1 ), S (f n ) = f n (t k 1 )(t k t k 1 ), k=1 13. Donc le supremum et l infimum sont ici respectivement un mximum et un minimum. k=1 Ch. Suquet, Cours I.P.É. 21 239
Annexe A. Intégrle de Riemnn sur [, b] et les sommes de Drboux inférieures : S (f) = j f(t k )(t k t k 1 ), S (f n ) = k=1 j f n (t k )(t k t k 1 ). k=1 Pr convergence simple de f n vers f sur [, b], on peut trouver n ε tel que n n ε, k =, 1,..., j, f(t k ) f n (t k ) < ε b. (A.55) En effet on n qu un nombre fini j + 1 d écrts à contrôler (rppelons que pour l instnt ε est fixé et donc j ussi) et pr convergence de f n (t k ) vers f(t k ), on trouve pour chque k =, 1,..., j un rng n ε,k à prtir duquel l inéglité ci-dessus est toujours rélisée. On prend lors n ε = mx k j n ε,k. En utilisnt (A.55) et l positivité des (t k t k 1 ), on en déduit imméditement que S (f) > S (f n ) ε, S (f) < S (f n ) + ε. (A.56) En reportnt ces inéglités dns (A.54), on obtient puis b S (f n ) 2ε < f n (t) dt 2ε < b b f(t) dt < S (f n ) + 2ε, f(t) dt < Autrement dit, nous vons trouvé un entier n ε tel que n n ε, b f n (t) dt b b f n (t) dt + 2ε. f(t) dt < 2ε. Comme ε étit rbitrire, ceci exprime précisément l convergence qund n tend vers l infini, de b f n(t) dt vers b f(t) dt. 24 Ch. Suquet, Cours I.P.É. 21
Annexe B Intégrle générlisée L intégrle de Riemnn étudiée dns l nnexe A concerne des fonctions f définies en tout point d un intervlle fermé borné [, b] et bornées sur cet intervlle. Il est utile de générliser cette notion u cs de fonctions définies sur un intervlle quelconque, suf peut-être en un nombre fini de points, et ps forcément bornées. Dns le cdre de ce cours, les principles pplictions de cette notion d intégrle générlisée concernent les lois à densité, l espérnce et les moments de vribles létoires. B.1 Construction Commençons pr exminer cette générlistion de l intégrle de Riemnn sur quelques exemples simples. Exemple B.1. Peut-on définir + e x dx? Ici l intervlle d intégrtion est [, + [ et l intégrnde f : x e x est définie et continue sur cet intervlle, donc en prticulier Riemnn intégrble sur tout sousintervlle fermé borné de l forme [, b]. L intégrle b e x dx bien un sens. Elle se clcule d illeurs imméditement pr primitivtion de f et vut [ e x ] b = 1 e b. Cette vleur pour limite 1 qund b tend vers l infini et il est nturel de prendre cette limite comme définition de l intégrle générlisée + e x dx. L interpréttion géométrique de ce résultt est que l ire de l hypogrphe H := {(x, y) R 2 ; x R +, y e x } vut 1, cf. figure B.1. Pour le justifier, on remrque que H est l réunion de l suite croissnte pour l inclusion (H n ) n 1, où H n est l hypogrphe de f entre et n. Pr continuité séquentielle croissnte de l mesure de Lebesgue λ 2, cf. proposition 2.16 pge 63, n on λ 2 (H) = lim n + λ 2 (H n ) = lim n + e x dx = 1. + x Exemple B.2. Peut-on définir 1 + x dx? 2 Comme dns l exemple B.1, l intégrle sur [, b] un sens pour tout b R +. Elle se clcule pr chngement de vrible u = x 2 et primitivtion : b x 1 + x 2 dx = 1 2 b 2 du 1 + u = 1 [ ] b 2 ln(1 + u) 2 = 1 2 ln(1 + b2 ). 241
Annexe B. Intégrle générlisée y x Fig. B.1 Hypogrphe H de f : x e x entre et + Cette quntité tend vers + lorsque b tend vers +. On conviendr donc que + x dx = +. 1 + x2 L interpréttion géométrique est que l ire de l hypogrphe de x x(1 + x 2 ) 1 entre et + est infinie. L justifiction repose sur l continuité séquentielle croissnte de λ 2 comme pour l exemple B.1. Exemple B.3. Peut-on définir l intégrle + cos x dx? L fonction cosinus est continue sur R, donc Riemnn intégrble sur tout intervlle [, b]. Le clcul pr primitivtion de cette intégrle donne b >, b cos x dx = [ sin x ] b = sin b. Lorsque b tend vers +, sin b n ps de limite, même dns R, on ne peut donc ps définir + cos x dx. Géométriquement, le domine H délimité pr le demi-xe des bscisses positives, l xe des ordonnées et l courbe y = cos x, x, n ps d ire lgébrique. y x Fig. B.2 Domine H délimité pr le grphe de f : x cos x entre et + dt Exemple B.4. Peut-on définir les intégrles t, α >? α Notons en prélble que si α, l réponse est immédite puisque sur [, 1] l fonction f : t t α est continue donc Riemnn intégrble. Pr contre si α >, f n est ps définie en, est continue sur ], 1] et tend vers + à droite en. 1 242 Ch. Suquet, Cours I.P.É. 21
B.1. Construction Puisque f est continue sur ], 1], elle est Riemnn intégrble sur tout intervlle [, 1] pour >. On v donc regrder l convergence éventuelle de I() := 1 f(t) dt lorsque tend vers pr vleurs supérieures. L intégrle I() se clcule pr primitivtion. Si α 1, on obtient 1 [ ] dt t α+1 1 >, I() = t = = 1 α+1 α α + 1 α + 1 Qund tend vers pr l droite, I() tend vers une limite finie 1/(1 α) si α+1 >, i.e. si α < 1. Pr contre si α + 1 <, I() tend vers +, compte tenu du signe négtif du dénominteur constnt α + 1. Dns le cs prticulier α = 1, une primitive de f est l fonction logrithme néperien, d où >, I() = 1 dt t = [ ln t ] 1 = ln, ce qui tend vers + qund tend vers pr l droite. Finlement nous pouvons écrire { 1 dt 1 t = si α < 1, 1 α α + si α 1. À nouveu on peut interpréter géométriquement ce résultt. Soit H α := {(t, y) R 2 ; < t 1 et y t α } l hypogrphe de f entre et 1, cf. figure B.3. Si α < 1, son ire est finie et vut (1 α) 1. Si α 1, son ire est infinie. Pour l justifiction, on peut utiliser l suite, croissnte pour l inclusion, des hypogrphes de f entre 1/n et 1. 1 dt Exemple B.5. Peut-on définir 1 t? L intégrnde f : t t 1 est définie et continue sur l intervlle «troué» [ 1, 1] \ {}. Elle est donc Riemnn intégrble sur chcun des intervlles fermés bornés [ 1, ] et [b, +1] pour 1 < < et < b < 1. Ceci nous mène à étudier l limite qund et b tendent vers respectivement à guche ou à droite de I(, b) := 1 dt t + 1 b dt t = [ ln t ] + [ ln t ] 1 = ln ln b. 1 b Qund et b tendent vers et + respectivement, ln et ln b tendent tous deux vers +, donc leur différence I(, b) n ps de limite. Si vous n en êtes ps convincu, regrdez ce problème de convergence vec les suites n := 1/n, b n = 1/n 2, puis vec les suites n = 1/n 2 et b n = 1/n. Dns le premier cs I( n, b n ) = ln n tend vers +, tndis que dns le second, I( n, b n) = ln n tend vers. Ceci interdit à l fonction de deux vribles (, b) I(, b) d voir une limite en (, ). On ne peut donc ps définir l intégrle générlisée 1 dt, même comme élément de R. Soit H le domine délimité 1 t pr le grphe de f et l xe des bscisses entre 1 et 1, i.e. H := {(t, y) R 2 ; t [ 1, 1] \ {}, (1/t) y (1/t) + }, Ch. Suquet, Cours I.P.É. 21 243
Annexe B. Intégrle générlisée y 1 t Fig. B.3 Hypogrphe H α de f : t t α entre et 1 y 1 1 t Fig. B.4 H := {(t, y) R 2 ; t [ 1, 1] \ {}, (1/t) y (1/t) + } 244 Ch. Suquet, Cours I.P.É. 21
B.1. Construction voir figure B.4. Le fit que l on ne puisse définir 1 1 lgébrique 1. dt t signifie que H n ps d ire Attention, il peut prître tentnt u vu de l imprité de f de définir 1 dt comme 1 t vlnt et de dire que l ire lgébrique de H est nulle. Il fut bsolument résister à cette tenttion. En effet, ceci reviendrit à dire que I(, b) tend vers qund (, b) tend vers (, ) simplement prce que I(, ) = pour tout [ 1, [. Après ces exemples introductifs, nous llons formliser l définition de l intégrle de Riemnn générlisée. Il est commode de désigner les ensembles d intégrtion considérés sous le nom 2 d «intervlle troué». Définition B.6 (intervlle troué). Soit I un intervlle quelconque de R et T = {t 1,..., t d } une prtie de crdinl d de I, l indextion des t i vérifint : t := inf I < t 1 < < t d < t d+1 := sup I +. On ppelle intervlle troué I T l ensemble I \ T. On lors I T = d i= I i, (B.1) vec I i :=]t i, t i+1 [ pour 1 i < d, I pour bornes t et t 1 et est ouvert à droite, I d pour bornes t d et t d+1 et est ouvert à guche. Nous engloberons dns cette définition et ces nottions le cs prticulier d = où il n y ps de trous, l réunion ci-dessus se réduisnt à I = I = I. Les ensembles d intégrtion utilisés dns les exemples B.1 B.5 sont insi des intervlles troués vec I = [, + [ et d = pour les exemples B.1, B.2 et B.3, I =], 1] et d = pour l exemple B.4, I = [ 1, 1], d = 1, t 1 = pour l exemple B.5. Définition B.7 (fonction loclement Riemnn intégrble). Soient I T un intervlle troué et f une fonction I T : R. On dit que f est loclement Riemnn intégrble sur I T si elle est Riemnn intégrble sur tout intervlle fermé borné [α, β] inclus dns I T, donc nécessirement inclus dns l un des intervlles I i de l décomposition (B.1). Définition B.8 (intégrle générlisée). Soient I un intervlle de R, de bornes, b R, T = {t 1,..., t d } un ensemble de trous dns I et f loclement Riemnn intégrble sur l intervlle troué I T. On dit que l intégrle générlisée de f entre et b converge si on peut trouver une suite finie c, c 1,..., c d vec c i I i pour i =,..., d telle que chcune des limites suivntes existe et soit finie : i =,..., d, lim x i t i+1, x i <t i+1 xi c i x i t i, f(t) dt =: l i, lim x i >t i ci x i f(t) dt =: l i. (B.2) 1. Pr contre il une ire λ 2 (H) = +, ce qui correspond u fit que 1 dt 1 t = + (exercice). 2. non stndrd. Ch. Suquet, Cours I.P.É. 21 245
Annexe B. Intégrle générlisée On dit lors que l intégrle générlisée b f(t) dt converge et on définit b f(t) dt comme le réel b d f(t) dt := (l i + l i ). (B.3) Si l une u moins des conditions (B.2) n est ps vérifiée, i.e. il n y ps de limite ou une limite infinie, on dit que l intégrle générlisée b f(t) dt diverge. Dns ce cs l écriture b f(t) dt ne représente ps un nombre réel. L utilistion du symbole b f(t) dt est nlogue à celle de + k= u k qui désigne à l fois une série et lorsqu elle converge dns R, s somme qui est le réel limite de l suite des sommes prtielles S n = n k= u k. L série peut diverger prce que l suite (S n ) n 1 tend vers + (resp. ), uquel cs on s utorise l écriture + k= u k = + (resp. = ). Mis elle peut ussi diverger prce que (S n ) n 1 n ps de limite, même infinie. Dns ce cs l écriture + k= u k est purement formelle et ne représente ps un élément de R. Pour l intégrle générlisée divergente b f(t) dt, on s utoriser l écriture b f(t) dt = + si certins des l i, ou l i vlent +, les utres étnt finis. De même on écrir b f(t) dt = si certins des l i, ou l i vlent, les utres étnt finis. Dns tous les utres cs de divergence 3, le symbole b f(t) dt est seulement une écriture formelle et ne représente ps un élément de R. Le lecteur ttentif n ur ps mnqué de noter que l définition B.8 pose un problème de cohérence cr l existence et l vleur de b f(t) dt semblent dépendre du choix de l suite c, c 1,..., c d. Le lemme suivnt répond à cette légitime inquiétude. Lemme B.9. Avec les nottions de l définition B.8, on suppose que l suite finie c, c 1,..., c d vérifie (B.2). Soit c, c 1,..., c d une suite telle que c i I i pour i =,..., d. Alors on xi i =,..., d, lim f(t) dt =: l ci i = l i + f(t) dt (B.4) x i t i+1, c x i <t i c i i+1 et i =,..., d, i= Une conséquence immédite de ce lemme est que ci lim f(t) dt =: l ci x i t i = l i + f(t) dt. (B.5) i, x i >t x i c i i d (l i + l i ) = i= d ( l i + l i ) puisque l i + l i = l i + l i, l somme de c i c i et c i c i s nnihilnt pr l reltion de Chsles. Ainsi ni l convergence de l intégrle générlisée de f entre et b ni l définition de s vleur pr (B.3) ne dépendent du choix de l suite c, c 1,..., c d. 3. i.e. si l une u moins des intégrles de (B.2) n ps de limite même dns R ou si elles ont toutes une limite dns R, mis vec u moins une des limites vlnt et u moins une vlnt +. i= 246 Ch. Suquet, Cours I.P.É. 21
B.1. Construction Preuve du lemme B.9. Puisque l on fit tendre x i vers t i+1 pr vleurs inférieures, on peut toujours supposer que mx(c i, c i ) < x i < t i+1. L fonction f est lors Riemnn intégrble sur [min(c i, c i ), x i ] et l reltion de Chsles combinée vec (B.2) nous donne xi c i f(t) dt = ci c i f(t) dt + L vérifiction de (B.5) est nlogue. xi c i f(t) dt x i t i+1, x i <t i+1 ci c i f(t) dt + l i. Remrque B.1. Dns le cs où l intervlle I de l définition B.8 est fermé en b (donc b I), l condition xd lim f(t) dt =: l d R x d b, c x d <b d est utomtiquement vérifiée. En effet, [c d, b] est inclus dns I T, donc f est Riemnn intégrble sur [c d, b] et l fonction x d x d c d f(t) dt est continue sur cet intervlle, cf. théorème A.31 i), donc continue à guche u point b, ce qui nous donne l existence de l limite finie l d et s vleur l d = b c d f(t) dt. En prtique on s bstiendr donc de revérifier l existence de cette limite. Pr exemple si f est loclement Riemnn intégrble sur ]c, b], il fut seulement regrder ce qui se psse u voisinge de c. Bien entendu si I, on une sitution nlogue, à svoir l convergence utomtique qund x + de c f(t) dt vers l intégrle de Riemnn ordinire c f(t) dt. x Nous définissons ussi les intégrles générlisées b définition A.2. Définition B.11. Si > b et si l intégrle générlisée b b f(t) dt := b f(t) dt. vec > b en cohérence vec l f(t) dt converge, on pose (B.6) Remrque B.12 (réduction du problème). Une fois pyé notre tribut u formlisme vec l définition B.8, il convient de se simplifier l vie en notnt que l étude de l convergence d une intégrle générlisée se rmène à l étude de limites du type c f(t) dt x qund x + vec f loclement Riemnn intégrble sur ], c] ou x f(t) dt qund c x b vec f loclement Riemnn intégrble sur [c, b[. Nous nous contenterons l pluprt du temps, d énoncer des résultts reltifs u deuxième type, en lissnt u lecteur le soin d écrire leur dpttion immédite u premier type et de recoller les morceux pr (B.3). Définition B.13 (nottion R loc [, b[). Soient et b tels que < < b +. Nous notons R loc [, b[ l ensemble des fonctions loclement Riemnn intégrbles sur [, b[. Pour étudier l convergence d une intégrle générlisée, on souvent recours à une technique de comprison vec une intégrle de référence. Les intégrles générlisées des fonctions puissnces t t α u voisinge de ou de + sont les intégrles de référence les plus utilisées. Ch. Suquet, Cours I.P.É. 21 247
Annexe B. Intégrle générlisée Proposition B.14. Soit α un réel. + dt ) converge si α > 1 et diverge si α 1. 1 tα 1 dt b) converge si α < 1 et diverge si α 1. tα Preuve. Le ) déjà été trité à l exemple B.4 en rppelnt que si α, on ffire à l intégrle de Riemnn ordinire d une fonction continue sur [, 1]. Pour le b), on note que f : t t α est continue sur [1, + [ donc loclement Riemnn intégrble sur cet intervlle, donc Riemnn intégrble sur tout intervlle [1, x] pour x 1. Pr primitivtion on { x dt x α+1 t = 1 si α 1, α+1 1 α α ln x si α 1. 1 On en déduit que pour α 1, x 1 t α dt tend vers + qund x tend vers + et que pour α > 1, x 1 t α dt tend vers l limite finie 1/(α 1) qund x tend vers +. Corollire B.15. Si < < b < + et si α est un réel, b b dt (t ) α converge si et seulement si α < 1, (B.7) dt (b t) α converge si et seulement si α < 1. (B.8) Preuve. C est une dpttion immédite de l preuve du ) ci-dessus, voir exemple B.4, vi les chngements de vrible u = t et v = b t respectivement. Dns l sitution de l proposition B.14, l intégrle diverge lorsque f tend trop vite vers + en dns le cs ) et tend trop lentement vers en + dns le cs b) 4. Dns le cs b), on peut penser à l nlogie vec l série de terme générl k α, cf. théorème 1.55 p. 26. Pour utnt il fut se grder de tirer des conclusions hâtives de cette nlogie. Si l convergence d une série implique toujours l convergence vers de son terme générl, l sitution est plus compliquée pour les intégrles de l forme + f(t) dt. Remrque B.16. L convergence de l intégrle + f(t) dt n implique ps que f(t) it pour limite en +. Voici un contre exemple. Prenons = et pour f l fonction continue ffine pr morceux dont l hypogrphe se réduit (en dehors des segments où f est nulle) à l réunion de l suite (T n ) n 1 des tringles isocèles de sommet principl (n, 2 n ) et de bse [n 4 n, n+4 n ], cf. figure 5 B.5. L fonction f vérifie les deux propriétés suivntes. 4. On pourrit d illeurs déduire le b) du ) pr un rgument géométrique sur les hypogrphes en notnt que les fonctions f : t t α et g : t t 1/α définies sur ], + [ sont réciproques l une de l utre, donc que leurs grphes en repère orthonormé se correspondent pr l symétrie reltivement à l première bissectrice du repère. Pr conservtion de λ 2, on en déduit que l hypogrphe de g entre 1 et + même ire que l hypogrphe de f entre et 1 privé du crré unité (fites le dessin!). 5. Pour des risons de lisibilité on muni l xe des ordonnées d une échelle logrithmique et on fortement exgéré l bse de chque tringle isocèle. 248 Ch. Suquet, Cours I.P.É. 21
B.1. Construction 1. + f(t) dt converge (et vut 1). 2. Pour tout n N, f(n) = 2 n et f(n + 1/2) =. Pr conséquent f n ps de limite en +. 2 n 2 3 2 2 2 1 2 3 n Fig. B.5 + f(t) dt peut converger sns que f it une limite en + Preuve. Comme fonction continue, f pprtient à R loc [, + [ donc est Riemnn intégrble sur tout intervlle [, x], x R +. Les tringles T n sont deux à deux disjoints et l ire λ 2 (T n ) se clcule pr l formule clssique demi-produit de l bse pr l huteur 6, d où λ 2 (T n ) = 4 n 2 n = 2 n. On en déduit imméditement que l série de terme générl λ 2 (T k ) est géométrique convergente. Le clcul de s somme prtielle S n est bien connu : S n := n λ 2 (T k ) = k=1 n n 1 2 k = 2 1 2 j 1 1 2 n = 2 1 2 = 1 1 2 n. k=1 j= Nous llons montrer l convergence de + f(t) dt en comprnt x f(t) dt et S n pour n = [x], l prtie entière de x. En effet, pour n fixé, g n : x x f(t) dt S n est une fonction croissnte puisque f est positive. Sur l intervlle [n, n + 1], cette fonction pour minimum g n (n) = 1λ 2 2(T n ) et pour mximum g n (n + 1) = 1λ 2 2(T n+1 ). Comme λ 2 (T n ) > λ 2 (T n+1 ), on en déduit x [n, n + 1], x f(t) dt S n 1 2 λ 2(T n ) < 2 n. 6. Si vous êtres sceptiques vous pouvez toujours chercher une expression nlytique pour l restriction de f à [n 4 n, n + 4 n ] et l intégrer sur ce segment pour voir si vous trouvez le même résultt. Ch. Suquet, Cours I.P.É. 21 249
Annexe B. Intégrle générlisée Compte-tenu du clcul de S n rppelé ci-dessus, ceci nous permet d écrire x x 1, f(t) dt ( 1 2 [x]) < 2 [x]. En fisnt tendre x vers +, on en déduit que x f(t) dt tend vers 1. Donc + f(t) dt converge et vut 1. Le point 2 est évident. Ce genre de pthologie n est ps réservé ux intégrles générlisées de l forme + f(t) dt. À titre d exercice, on vous lisse le soin de construire une fonction f continue sur [, 1[ telle que 1 f(t) dt converge et qu il existe 3 suites (u n) n 1, (v n ) n 1 et (w n ) n 1 convergentes vers 1 dns [, 1[ telles que f(u n ) tende vers +, f(v n ) tende vers et f(w n ) tende vers. Voici une suggestion prmi les multiples solutions possibles. Découper [, 1[ en trois segments de même longueur [, 1/3[, [1/3, 2/3[ et [2/3, 1[. Sur les deux premiers prendre pour grphe de f les tringles isocèles de bse ces segments et de «huteurs» respectives +2 et 2. Itérer ce prtge en trois sur [2/3, 1[ vec sur les deux premiers segments du prtge des tringles isocèles de huteur +4 et 4 et insi de suite jusqu à l infini. Après ces contre exemples, voyons ce que l on peut dire dns des situtions moins pthologiques sur l reltion entre convergence de + f(t) dt et comportement de f u voisinge de +. Proposition B.17. Soit f R loc [, + [. i) On suppose qu il existe A [, + [ et m > tels que f(t) m pour tout t A. Alors + f(t) dt diverge. ii) Cette divergence lieu ussi s il existe m < et A tels que f(t) m pour tout t A. iii) En conséquence, si f une limite non nulle l R en +, + f(t) dt diverge. Preuve. Pour i), il suffit de remrquer que pour tout x A, x f(t) dt = A f(t) dt + x A f(t) dt A f(t) dt + m(x A), pr croissnce de l intégrle de Riemnn sur [A, x], voir l proposition A.21 ii) et l figure B.6. En fisnt tendre x vers +, on en déduit que x f(t) dt tend vers +, d où l divergence de + f(t) dt. De même pour ii), on obtient l minortion x f(t) dt A f(t) dt + m (x A) et donc x f(t) dt tend vers qund x tend vers +. Supposons mintennt que f it une limite non nulle l R en +. On peut distinguer 4 cs. Cs 1. l ], + [, lors il existe un A tel que pour tout t A, f(t) > l. On 2 pplique i) vec m = l >. 2 Cs 2. l = +, lors il existe un A tel que pour tout t A, f(t) 1, on pourrit bien sûr remplcer ce minornt 1 pr n importe quel réel B > choisi à l vnce 7. On pplique i) vec m = 1. 7. Mis ps pr l 2 qui ici le muvis goût de vloir +! 25 Ch. Suquet, Cours I.P.É. 21
B.2. Critère de Cuchy pour intégrles générlisées y m m(x A) A x t Fig. B.6 x f(t) dt m(x A) A Cs 3. l ], [, lors il existe un A tel que pour tout t A, f(t) < l 2. On pplique ii) vec m = l 2 <. Cs 4. l =, lors il existe un A tel que pour tout t A, f(t) 1. On pplique ii) vec m = 1. Corollire B.18. Soit un réel et f une fonction positive et décroissnte sur [, + [. Si + f(t) dt converge, lors f tend vers en +. Preuve. Une fonction décroissnte sur [A, + [ est loclement Riemnn intégrble sur cet intervlle, cf. proposition A.9. D utre prt comme fonction monotone, elle dmet toujours en + une limite l R. Pr décroissnce et positivité de f, cette limite est nécessirement dns [, + [. Si l >, lors pr le cs 1 ci-dessus, + f(t) dt diverge, ce qui contredit l hypothèse de convergence de cette intégrle. Donc l =. B.2 Critère de Cuchy pour intégrles générlisées L intérêt du critère de Cuchy dns un espce complet est de permettre d étblir l existence d une limite sns connître priori s vleur. Nous llons voir une version de ce critère pour l convergence des intégrles générlisées. Auprvnt, il n est peutêtre ps superflu de rppeler quelques versions du critère de Cuchy pour l existence de limites de suites ou de fonctions. Proposition B.19 (critères de Cuchy). 1. L suite de réels (u n ) n 1 converge dns R si et seulement si ε >, N N, n, p N, u n u p < ε. (B.9) 2. Soit F une fonction à vleurs réelles ou complexes, définie sur D R et un point dhérent à D. Alors F une limite finie u point si et seulement si : ε >, δ >, x, x D ] δ, + δ[\{}, F (x) F (x ) < ε. (B.1) Ch. Suquet, Cours I.P.É. 21 251
Annexe B. Intégrle générlisée 3. Soit F une fonction à vleurs réelles ou complexes, définie sur D R et R tel que pour tout réel η >, D ], + η[ soit non vide. Alors F une limite à droite finie u point si et seulement si : ε >, δ >, x, x D ], + δ[, F (x) F (x ) < ε. (B.11) 4. Soit F une fonction à vleurs réelles ou complexes, définie sur D R et R tel que pour tout réel η >, D ] η, [ soit non vide. Alors F une limite à guche finie u point si et seulement si : ε >, δ >, x, x D ] δ, [, F (x) F (x ) < ε. (B.12) 5. Soit F une fonction à vleurs réelles ou complexes, définie sur un intervlle [, + [, R. Alors F une limite finie en + si et seulement si : ε >, A >, x, x A, F (x) F (x ) < ε. (B.13) De même que l ppliction du critère de Cuchy (B.9) à l suite des sommes prtielles d une série conduit u critère de Cuchy pour les séries, cf. théorème 1.5, les critères (B.1) (B.13) nous fournissent des critères de Cuchy pour l convergence d intégrles générlisées. Nous les énoncerons seulement pour l convergence en b des intégrles b f(t) dt en utilisnt (B.12) ou (B.13) selon que b est fini ou non. Au lecteur de compléter. Théorème B.2 (critère de Cuchy pour les intégrles). 1. Soit f R loc [, + [. L intégrle générlisée + f(t) dt converge si et seulement si : x ε >, A >, x, x A, f(t) dt < ε. (B.14) 2. Soit f R loc [, b[, vec b < +. Alors b f(t) dt converge si et seulement si : ε >, δ ], b [, x, x ]b δ, b[, x x x f(t) dt < ε. (B.15) Preuve. Il suffit d ppliquer le critère de Cuchy (B.12) ou (B.13) à l fonction F : [, b[ R, x F (x) := x f(t) dt qui est bien définie sur [, b[ puisque f est Riemnn intégrble sur [, x] pour tout x [, b[. Corollire B.21. Soit f R loc [, b[ vec b fini. 1. Si f est bornée sur [, b[, lors b f(t) dt converge. 2. Si f une limite à guche finie en b, lors b f(t) dt converge. 252 Ch. Suquet, Cours I.P.É. 21
B.2. Critère de Cuchy pour intégrles générlisées Preuve. Vérifions le point 1. Pr hypothèse, il existe M R + tel que pour tout t [, b[, f(t) M. D utre prt f étnt loclement Riemnn intégrble sur [, b[ est Riemnn intégrble sur tout segment [x, x ] [, b[. Pr croisnce de l intégrle de Riemnn, cf. proposition A.21, on en déduit : x x x, x [, b[ vec x < x, f(t) dt f(t) dt M(x x). (B.16) x Cette inéglité nous permet de vérifier le critère de Cuchy (B.15). En effet, soit ε > rbitrire. Posons δ := min(ε/m, b ). Pour tous x, x ]b δ, b[, on clirement M(x x) < ε, donc compte-tenu de (B.16), x f(t) dt x < ε. Pour le point 2, il suffit de noter que si f une limite finie l à guche en b, lors sur un intervlle ]b δ, b[ suffismment petit, on f(t) l +1. Comme f est ussi bornée sur [, b δ ] cr Riemnn intégrble sur ce segment, elle est bornée sur l réunion des deux intervlles, i.e. sur [, b[ et on conclut en ppliqunt le point 1. ( 1 ) Exemple B.22. L intégrle générlisée sin dt converge. t 1/π En effet, f : t sin(1/t) est définie et continue sur [ 1/π, [, donc f R loc [ 1/π, [. Elle est bornée sur cet intervlle puisque sin(1/t) 1 pour tout t R. Le point 1 du corollire B.21 nous donne l convergence de f(t) dt. Notons u pssge que f n 1/π ps de limite à guche en zéro, cr elle oscille une infinité de fois entre les vleurs 1 et 1 sur tout voisinge à guche de, ussi petit soit-il, cf. figure B.7. x y 1 1 π t 1 Fig. B.7 Grphe de t sin(1/t) pour t [ 1, ] 2 π 39π Corollire B.23. Soit f R loc [, b[). Si b f(t) dt converge, lors b f(t) dt converge. Preuve. Pr le théorème B.2, l convergence de b f(t) dt implique le critère de Cuchy (B.14) si b R ou (B.15) si b = +, vec f à l plce de f. L inéglité x x f(t) dt f(t) dt x montre que le critère de Cuchy correspondnt est ussi vérifié pr f, d où l convergence de b f(t) dt pr une nouvelle invoction du théorème B.2. x Ch. Suquet, Cours I.P.É. 21 253
Annexe B. Intégrle générlisée Remrque B.24. L réciproque du corollire B.23 est fusse. Nous verrons un peu plus trd que pr (contre) exemple, + sin t dt converge, lors que + sin t 1 t 1 t dt diverge. Définition B.25 (convergence bsolue). Soit f R loc [, b[). Si b f(t) dt converge, on dit que b f(t) dt est bsolument convergente. Une intégrle bsolument convergente est toujours convergente (cor. B.23), l réciproque est fusse (rem. B.24). Le théorème suivnt permet entre utres de montrer l convergence d intégrles de l forme + f(t) sin t dt vec f positive décroissnte et tendnt vers en +. S preuve combine le critère de Cuchy et l deuxième formule de l moyenne que nous n vons ps vue. Nous dmettrons ce théorème. Théorème B.26 (critère d Abel). Soient f, g R loc [, + [ et vérifint i) f est positive et décroissnte sur [, + [ et pour limite en +. ii) Il existe une constnte M telle que Alors + f(t)g(t) dt converge. x, y [, + [, y x g(t) dt M. Si on prend en prticulier g(t) = sin t, il est fcile de vérifier (B.17). En effet y x sin t dt = [ cos t ] y = cos x cos y et cos x cos y 2. x (B.17) Il en v de même vec g(t) = cos t, ou g(t) = sin(ct), ou g(t) = cos(ct). Énonçons séprément ce cs prticulier du théorème B.26 vnt d en proposer une démonstrtion directe. Proposition B.27. Si f est positive et décroissnte sur [, + [ et pour limite en +, les intégrles générlisées + f(t) sin t dt et + f(t) cos t dt convergent. Preuve. Nous montrerons simplement l convergence de + f(t) sin t dt, l dpttion de l méthode u cs de + f(t) cos t dt étnt immédite. Remrquons d bord que l intégrnde h : t f(t) sin t est loclement Riemnn intégrble sur [, + [. En effet, les restrictions des fonctions f et sin u segment [α, β] [, + [ sont respectivement monotone et continue donc Riemnn intégrbles. Leur produit h est donc ussi Riemnn intégrble sur [α, β], cf. prop. A.26. Ceci étnt vri pour tout [α, β] [, + [, h est dns R loc [, + [. Notons I k := [kπ, (k + 1)π], k N. Pour k ssez grnd, disons k k, I k [, + [. Aux bornes de I k, sin t s nnule et pour tout t intérieur à I k, sin t même signe que ( 1) k. On donc pour tout t I k, sin t = ( 1) k sin t d où (k+1)π kπ (k+1)π f(t) sin t dt = ( 1) k f(t) sin t dt =: ( 1) k v k. kπ (B.18) 254 Ch. Suquet, Cours I.P.É. 21
B.2. Critère de Cuchy pour intégrles générlisées y f() f() sin t Fig. B.8 Grphe de t f(t) sin(t) vec f, grphes de f et f en pointillés On vérifie mintennt que l convergence qund x tend vers + de x h(t) dt se réduit à l convergence de l série de terme générl ( 1) k v k. Pour x > k π, il existe un unique entier n tel que (n + 1)π x < (n + 2)π. Cet entier dépendnt de x tend évidemment vers + vec x. On peut lors écrire x h(t) dt = k π h(t) dt + (n+1)π h(t) dt + x k π (n+1)π h(t) dt. (B.19) Tritons d bord le terme «résiduel» ε(x) := x (n+1)π h(t) dt, en notnt que pr l mjortion sin t 1 et l décroissnce de f, ε(x) x (n+1)π h(t) dt x (n+1)π f(t) dt ( x (n + 1)π ) f ( (n + 1)π ) πf ( (n + 1)π ). Or f tend vers en + et n = n(x) tend vers l infini vec x, donc ε(x) tend vers en +. En notnt C l constnte k π h(t) dt, en utilisnt l reltion de Chsles et (B.18), nous pouvons insi réécrire (B.19) sous l forme x n h(t) dt = C + ( 1) k v k + ε(x), k=k lim ε(x) =. x + Il est lors clir que l convergence en + de x h(t) dt vers une limite finie équivut à l convergence de l série de terme générl ( 1) k v k. L convergence de cette série résulter du théorème des séries lternées (th. 1.59) si l on montre que l suite (v k ) k k tend vers en décroissnt. Les mêmes mjortions que celles utilisées pour ε(x) nous donnent v k = (k+1)π kπ f(t) sin t dt πf(kπ) k +. Ch. Suquet, Cours I.P.É. 21 255
Annexe B. Intégrle générlisée f(kπ) π v k+1 kπ t Fig. B.9 v k cr πf(kπ) v k v k+1 Pour vérifier l décroissnce de (v k ) k k, comprons v k et v k+1 grâce u chngement de vrible s = t + π qui trnsforme I k+1 en I k : v k+1 = (k+2)π (k+1)π f(s) sin s ds = (k+1)π kπ f(t + π) sin t dt. Pr décroissnce de f on pour tout t I k, f(t) sin t f(t + π) sin t d où pr intégrtion de cette inéglité sur I k, v k v k+1. + sin t Exemple B.28. L intégrle dt est convergente, mis ps bsolument. 1 t L convergence résulte de l proposition B.27 vec f(t) = 1/t. Vérifions que l intégrle n est ps bsolument convergente. Pour x π, il existe un unique entier n tel que (n + 1)π x < (n + 2)π et cet entier dépendnt de x tend vers + vec x. En posnt h(t) := t 1 sin t et v k := (k+1)π h(t) dt, on kπ x π n x n h(t) dt = h(t) dt + v k + h(t) dt v k. 1 1 k=1 (n+1)π Pour prouver que x h(t) dt tend vers + vec x, il suffit donc de montrer l divergence 1 de l série de terme générl positif v k. Ceci résulte de l minortion suivnte qui utilise l décroissnce de t 1/t et l π-périodicité de sin t : v k = (k+1)π kπ sin t t dt (k+1)π kπ sin t (k + 1)π dt = 1 (k + 1)π π k=1 sin t dt = 2 (k + 1)π. Comme l série de terme générl positif u k := 2 diverge (cor. 1.56), on en déduit (k+1)π que n n v k u k +. n + k=1 k=1 Ainsi x h(t) dt tend bien vers + vec x. 1 Nous vons choisi pour cet exemple d intégrer entre 1 et +, mis le résultt reste vlble en intégrnt l même fonction entre et +. On vous lisse en exercice l justifiction de l convergence en. 256 Ch. Suquet, Cours I.P.É. 21
B.3. Intégrles générlisées de fonctions positives B.3 Intégrles générlisées de fonctions positives L fonction f définie sur [, b[ est dite positive sur [, b[ si pour tout t [, b[, f(t). Nous énoncerons tous les résultts de cette section vec des fonctions positives sur [, b[, mis il est clir qu ils s étendent u cs plus générl des fonctions f définies sur [, b[ et positives u voisinge de b, i.e. il existe un c [, b[ tel que t [c, b[, f(t). Ils s étendent ussi u cs des fonctions de signe constnt u voisinge de b, modulo une dpttion lissée u lecteur. Soit f R loc [, b[ et positive sur [, b[. Alors l fonction F définie pr F (x) := x f(t) dt, est croissnte sur [, b[. En effet si x x < b, F (x ) F (x ) = x x [, b[, x f(t) dt, (B.2) pr positivité de f sur [x, x ]. Il n y donc que deux possibilités pour le comportement de F (x) qund x tend vers b à guche. 1. L fonction croissnte F est mjorée sur [, b[, i.e. il existe M R + tel que pour tout x [, b[, F (x) M < +. Alors F une limite finie l à guche en b (l M), utrement dit l intégrle générlisée b f(t) dt converge et b f(t) dt = l. 2. L fonction croissnte F n est ps mjorée sur [, b[. Alors F tend vers + à guche en b, l intégrle générlisée b f(t) dt diverge et b f(t) dt = +. Rppelons ici qu il existe des intégrles divergentes uxquelles on ne peut ttribuer ucune vleur, ps même infinie, voir l exemple B.3. Comme nous venons de le voir, ce type de divergence ne peut se produire lorsque f est de signe constnt. Théorème B.29 (comprison). Soient f, g R loc [, b[ telles que f g sur [, b[. Alors b b g(t) dt converge = f(t) dt diverge = b b f(t) dt converge, g(t) dt diverge. (B.21) (B.22) Preuve. Soit x quelconque dns [, b[. Alors f et g sont Riemnn intégrbles sur [, x] et en intégrnt sur cet intervlle l inéglité f g, on voit que x [, b[, F (x) := x f(t) dt x g(t) dt =: G(x). Comme f et g sont positives, les fonctions F et G sont croissntes d près (B.2). Si x g(t) dt converge, cel signifie que G une limite à guche finie L en b. L fonction croissnte G est donc mjorée sur [, b[ pr L et F l est ussi puisque F G Ch. Suquet, Cours I.P.É. 21 257
Annexe B. Intégrle générlisée sur [, b[. Étnt croissnte sur [, b[ et mjorée pr L < + sur cet intervlle, F ussi une limite à guche finie l L en b. Autrement dit, b f(t) dt converge. Ceci étblit l impliction (B.21). Si x f(t) dt diverge, le point 2 de l lterntive ci-dessus entre en vigueur 8. Autrement dit, F (x) tend vers + à guche en b. Il en v de même pour G puisque F G. Donc g(t) dt = + et cette intégrle diverge. L impliction (B.21) est insi vérifiée. b Exemple B.3. Les intégrles «gussiennes» + e ct2 dt, c >, convergent. Pr réduction du problème, cf. remrque B.12, on se rmène à l étude séprée de et de +. Pr prité de l intégrnde f : t exp( ct 2 ), il est clir qu il suffit d étudier l convergence de l intégrle générlisée de f sur [, + [. Notons u pssge que f est continue sur R, donc clirement membre de R loc ], ] et de R loc [, + [. Puisque f est en prticulier Riemnn intégrble sur [, 1], le découpge x f(t) dt = 1 f(t) dt+ x f(t) dt nous rmène finlement à l étude de l convergence de + f(t) dt. 1 1 Cette dernière réduction est motivée pr l inéglité t 2 t pour t 1. Pr positivité de c et croissnce de l fonction exponentielle, on en déduit ct 2 ct et f(t) = exp( ct 2 ) exp( ct) =: g(t). Nous pouvons lors ppliquer l impliction (B.21) pour conclure à l convergence de + f(t) dt. En effet 1 x 1 [ exp( ct) exp( ct) dt = c donc + 1 g(t) dt converge. ] x 1 = exp( c) c exp( cx) c x + exp( c), c Corollire B.31. Soient f, g R loc [, b[. On suppose que f g sur [c, b[ pour un c [, b[ et que b g(t) dt converge. Alors l intégrle générlisée b f(t) dt est bsolument c convergente. Preuve. Les fonctions f et g (donc ussi leur vleur bsolue) sont Riemnn intégrbles sur [, c]. Le découpge x = c + x montre lors que l convergence bsolue de c b f(t) dt équivut à celle de b f(t) dt. Cette dernière convergence découle imméditement de celle de b c g(t) dt pr (B.21) ppliqué sur [c, b[ u lieu de [, b[, vec f à l c plce de f. Exemple B.32. L intégrle + 1 sin(t cos t) dt converge bsolument. t 2 C est une ppliction immédite du corollire B.31 vec = c = 1 et g(t) = t 2. Théorème B.33 (intégrndes équivlentes). Soient f, g R loc [, b[, positives u voisinge à guche de b. Si elles sont équivlentes en b, b f(t) dt et b g(t) dt sont de même nture. 8. Prce que f est positive sur [, b[. 258 Ch. Suquet, Cours I.P.É. 21
B.3. Intégrles générlisées de fonctions positives Preuve. Rppelons que «f équivlente à g en b» noté encore f g signifie qu il existe b un réel c [, b[ et une fonction h définie que [c, b[ telle que t [c, b[, f(t) = g(t)h(t) et lim t b h(t) = 1. Cette limite à guche de h en b nous permet de trouver un d [c, b[ tel que l encdrement 1/2 h(t) 3/2 soit vérifié 9 pour tout t [d, b[. Pr positivité de f et g u voisinge de b et quitte à remplcer d pr d [d, b[, on se rmène u cs où g est positive sur [d, b[. On lors d où l on tire t [d, b[, x [d, b[, 1 2 g(t) 2 x d g(t) dt f(t) = g(t)h(t) 3g(t) 2, (B.23) x d f(t) dt 3 2 x d g(t) dt. (B.24) Supposons que b g(t) dt diverge. Comme d g(t) dt est une constnte finie, b g(t) dt d diverge ussi. Pr positivité de g sur [d, b[, x g(t) dt tend lors vers + qund x tend d vers b à guche. Il en v de même pour x f(t) dt à cuse de l première inéglité dns d (B.24). Pr ddition de l constnte d f(t) dt on voit finlement que x f(t) dt tend vers + en b. Ainsi l divergence de b g(t) dt implique celle de b f(t) dt. Si b g(t) dt converge, l ensemble { x g(t) dt; x [d, b[ } est mjoré et l deuxième d inéglité dns (B.24), montre qu il en v de même pour { x f(t) dt; x [d, b[ }. On d en déduit fcilement que b f(t) dt converge en utilisnt l positivité sur [d, b[ de f qui résulte de (B.23). Corollire B.34. Soient f, g R loc [, b[ telles que g soit strictement positive sur un voisinge à guche de b et que f(t) lim t b g(t) = K, K ], + [. (B.25) Alors b f(t) dt converge si et seulement si b g(t) dt converge. Preuve. L positivité stricte de g sur un voisinge à guche de b et (B.25) impliquent que f et Kg sont toutes deux positives sur un même voisinge [c, b[ de b et que f et Kg sont équivlentes en b. On conclut en ppliqunt le théorème B.33 à f et Kg. Exemple B.35. I := 1 t α (1 t) β dt converge si et seulement si α > 1 et β > 1. L intégrnde f : t t α (1 t) β est toujours continue u moins sur ], 1[, donc f est loclement Riemnn intégrble sur ], 1[. 9. Appliquer l définition de l limite vec ε = 1/2. Ch. Suquet, Cours I.P.É. 21 259
Annexe B. Intégrle générlisée Pour α et β, f est continue sur [, 1] donc Riemnn intégrble sur [, 1]. I est lors une intégrle ordinire. Si α < ou β <, I est une intégrle générlisée. Pour étudier s convergence, on regrde séprément 1/2 et 1. Notons que f est strictement 1/2 positive sur ], 1[, ce qui nous permet d utiliser le théorème B.33. On voit insi que t α (1 t) β + t α et t α (1 t) β 1 (1 t) β. Compte-tenu du corollire B.15, on en déduit que I converge si et seulement si α > 1 et β > 1. Exemple B.36. I := + dt 1 + t 3 converge. On envie de dire que c est une ppliction immédite du théorème B.33 puisque f(t) := (1 + t) 3 t 3 =: g(t) en +. Mis lors on introduit rtificiellement un problème en zéro pour g et + g(t) dt diverge (à cuse de l borne ). En y regrdnt de plus près, on voit que les hypothèses du théorème B.33 ne sont ps toutes vérifiées puisque g est loclement intégrble sur ], + [, mis ps sur [, + [. Notons que f elle, est bien dns R loc [, + [ comme fonction continue sur [, + [. On se sort de de muvis ps en remrqunt que I et + 1 f(t) dt sont de même nture et en ppliqunt le théorème B.33 sur l intervlle [1, + [ vec les restrictions de f et g à cet intervlle. En effet + t 3 dt converge pr l proposition B.14 ). 1 On urit pu ussi prouver pr cette méthode l convergence de + ce cs, il y bien plus simple puisque x tend vers +. Donc on voit directement que + + dt, mis dns 1+t 2 dt = rctn(x) qui tend vers π/2 lorsque x 1+t 2 dt converge et vut π/2. 1+t 2 3t + 2 Exemple B.37. I := dt converge. 5t 3 + t 2 + 4 L intégrnde f : t (3t+2)(5t 3 +t 2 +4) 1 est positive et continue sur [, + [ comme quotient de deux fonctions continues cr le dénominteur qui est minoré pr 4 sur cet intervlle ne s y nnule ps. Ainsi f pprtient à R loc [, + [. D utre prt en +, f(t) est équivlent à 3 5 t 2 =: g(t). On est confronté u même piège qu à l exemple B.36 et il fut éviter d introduire rtificiellement un problème en à cuse de l divergence de ε g(t) dt. Là encore il suffit de se rmener à + f(t) dt qui converge pr comprison 1 vec + 1 t 2 dt. π 2 dt Exemple B.38. I := converge si et seulement si α < 1. (cos t) α Sur [, π/2] l fonction continue cosinus ne s nnule qu u point π/2 et est positive illeurs. Pour α, l intégrnde f : t (cos t) α est continue sur [, π/2] et I est une intégrle de Riemnn ordinire. Pour α >, f est continue sur [, π/2[ et tend vers + à guche en π/2. Dns ce cs f R loc [, π/2[ et I est une véritble intégrle générlisée. Un développement limité à l ordre 1 du cosinus u point π/2 s écrit : cos t = cos π ( 2 + sin π )( t π ) 2 2 + ( t π ) ( ε 2 t π 2 ), ε(u) u, 26 Ch. Suquet, Cours I.P.É. 21
B.3. Intégrles générlisées de fonctions positives d où cos t = ( π )( ( 2 t 1 ε t π )), 2 utrement dit, cos t pour équivlent π/2 t en π/2. On en déduit que ( π ) α f(t) π2 2 t =: g(t). L fonction g étnt comme f, continue et positive sur [, π/2[, le théorème B.33 s pplique et nous dit que I et π/2 (π/2 t) α dt sont de même nture. Cette dernière intégrle converge si et seulement si α < 1 pr le corollire B.15. Remrque B.39. Le théorème B.33 s dpte imméditement u cs où f et g sont toutes deux négtives u voisinge à guche de b. Pr contre et même si f et g sont de même signe u voisinge à guche de b, le théorème n est plus vlble si f n ps un signe constnt u voisinge de b. Le contre exemple suivnt devrit vous en convincre. Exemple B.4 (à méditer). Définissons f, g : [1, + [ R pr f(t) := sin t t, g(t) := sin t + sin2 t. (B.26) t t Alors f(t) g(t) en +, f chnge de signe une infinité de fois u voisinge de +, f et g sont de même signe u voisinge de +. L intégrle générlisée + f(t) dt 1 converge mis + g(t) dt diverge. 1 Justifictions. Les fonctions f et g sont continues sur [1, + [ donc dns R loc [1, + [. On note d bord que pour tout t [1, + [, g(t) = f(t)h(t) vec g(t) = f(t)h(t) vec h(t) = 1 + sin t 1. (B.27) t t + Ceci étblit l équivlence de f et g en +. L fonction f ynt le signe du sinus chnge de signe une infinité de fois u voisinge de +. Il en v de même pour g à cuse de (B.27) puisque h(t) est strictement positif 1 sur [1, + [. De plus, f et g ont même signe et mêmes zéros sur tout l intervlle [1, + [. L intégrle générlisée + f(t) dt converge pr le théorème d Abel ou l proposition B.27. 1 Supposons que + g(t) dt converge, lors nécessirement + t 1 sin 2 t dt doit conver- 1 1 ger. En effet x 1 sin 2 t t dt = x 1 g(t) dt x 1 f(t) dt et le second membre doit voir une limite finie qund x tend vers + en rison de l convergence des deux intégrles + f(t) dt et + g(t) dt. Nous llons montrer que 1 1 1. Il suffirit que h soit strictement positive sur un voisinge [c, + [ de +, ce qui découle du fit que h une limite strictement positive en +. Mis ici il est plus simple de remrquer que t 1/2 sin t > 1 pour t > 1 et que h(1) = sin 1 >. Ch. Suquet, Cours I.P.É. 21 261
Annexe B. Intégrle générlisée l on boutit à une contrdiction en vérifint directement que + t 1 sin 2 t dt diverge. 1 En effet, l identité sin 2 t = 1 (1 cos 2t) nous donne 2 x sin 2 t x ( 1 cos 2t ) [ ] x 1 dt = dt = 1 t 1 2t 2t 2 ln t 1 1 x cos 2t dt = 1 2 1 t 2 ln x 1 x cos 2t dt. 2 1 t 1 Qund x tend vers +, ln x tend vers +, tndis que 1 cos 2t dt tend vers une 2 2 t limite finie cr 1 + cos 2t dt converge grâce u théorème d Abel ou à l proposition B.27 2 1 t (poser s = 2t). Donc x 1 t 1 sin 2 t dt tend vers + vec x, utrement dit + t 1 sin 2 t dt 1 diverge, ce qui étblit l contrdiction nnoncée et impose l divergence de + g(t) dt. 1 x 1 B.4 Divers B.4.1 Chngements de vrible Nous exminons l extension des formules de chngement de vrible u cs des intégrles générlisées. Grosso modo tout se psse bien lorsque l on utilise un chngement de vrible monotone. Si ce n est ps le cs, il convient d être prudent et de revenir à l définition de l intégrle générlisée b = lim x x b pour ppliquer le chngement de vrible ux intégrles de Riemnn ordinires x vnt de fire tendre x vers b. Proposition B.41 (trnsltion et chngement d échelle). i) Trnsltion. Soient c R et f loclement Riemnn intégrble sur [ + c, b + c[, vec b + c := + si b = +. Alors l ppliction g : [, b[ R, t f(t + c) est loclement Riemnn intégrble sur [, b[. Les intégrles b g(t) dt et b+c f(s) ds +c sont de même nture. Si l une des deux converge on b f(t + c) dt = b+c +c f(s) ds. (B.28) Cette églité reste vrie dns R + sns hypothèse de convergence si f ou g est positive sur son intervlle d intégrtion. ii) Chngement d échelle. Soient c R et f loclement Riemnn intégrble sur l intervlle d extrémités 11 c et bc, semi-fermé en c, vec dns le cs où b = +, bc := + si c >, bc := si c <. Alors l ppliction h : [, b] R, t f(ct) est loclement Riemnn intégrble sur [, b[. Les intégrles b h(t) dt et bc f(s) ds c sont de même nture. Si l une des deux converge on b f(ct) dt = 1 c bc c f(s) ds. (B.29) Cette églité reste vrie dns R + sns hypothèse de convergence si f ou h est positive sur son intervlle d intégrtion. 11. Il s git de [c, bc[ si c > et de ]bc, c] si c <. 262 Ch. Suquet, Cours I.P.É. 21
B.4. Divers Remrquons qu il n y ici ucune hypothèse de continuité sur f pour ces formules de chngement de vrible pr trnsltion ou chngement d échelle dns les intégrles générlisées. On peut donc les ppliquer notmment vec des fonctions décroissntes positives qui peuvent voir une infinité de discontinuités, mis sont toujours loclement Riemnn intégrbles. Preuve de i). Puisque f R loc [ + c, b + c[, elle est Riemnn intégrble sur le segment [+c, x+c] pour tout x [, b[. Alors pr l proposition A.32 i), g est Riemnn intégrble sur [, x] et ceci vlnt pour tout x [, b[, g est bien dns R loc [, b[. De plus on pr l formule de chngement de vrible (A.46) : x [, b[, x g(t) dt = x f(t + c) dt = x+c +c f(s) ds. En fisnt tendre x vers b, on en déduit que b g(t) dt et b+c f(s) ds sont de même +c nture. Si l une des deux intégrles générlisées converge, cel signifie que l intégrle de Riemnn ordinire correspondnte ci-dessus une limite dns R qund x tend vers b. En rison de l églité, il en v de même pour l utre intégrle et les limites sont égles, ce qui nous donne (B.28). Si f ou g est positive, ces deux intégrles dépendnt de x ont toujours une limite dns R + et les limites sont égles. Preuve de ii). L preuve est nlogue à celle de i) à quelques lourdissements d écriture près que l uteur bndonne lâchement u lecteur. Voici mintennt une extension prtielle 12 ux intégrles générlisées du chngement de vrible «clssique» de l proposition A.32 iii). Proposition B.42 (chngement de vrible C 1 monotone). Soit ϕ : [, b[ R, une fonction monotone ynt une dérivée continue sur [, b[. On suppose de plus que ϕ est strictement monotone u voisinge à guche de b. Pour toute fonction f continue sur l intervlle ϕ([, b[), les deux intégrles générlisées ci-dessous sont de même nture et si l une converge on b f ( ϕ(t) ) ϕ (t) dt = ϕ(b ) ϕ() f(s) ds, (B.3) où ϕ(b ) R désigne l limite à guche de ϕ en b. Cette églité demeure vrie dns R sns condition de convergence si f est de signe constnt sur l intervlle ϕ([, b[). Notons h := (f ϕ)ϕ. L condition sur l stricte monotonie de ϕ à guche de b est là pour écrter un cs rtificiel où l intégrle b h(t) dt est une intégrle de Riemnn ordinire d un fonction continue sur un intervlle [, c]. En effet si ϕ est constnte sur [c, b[ pour un c [, b[, on voit que x h(t) dt = c h(t) dt pour tout x [c, b[ en rison de l nullité de ϕ sur [c, b[. En fisnt tendre x vers b, cette églité nous 12. On noter l hypothèse plus restrictive sur le chngement de vrible ϕ. Ch. Suquet, Cours I.P.É. 21 263
Annexe B. Intégrle générlisée donne b h(t) dt = c h(t) dt. Comme h est continue sur [, c], le chngement de vrible clssique prop. A.32 iii) nous donne c h(t) dt = ϕ(c) f(s) ds et comme ϕ(b ) = ϕ(c), ϕ() on obtient bien (B.3). On voit insi que dns ce cs les deux intégrles dns (B.3) sont de fusses intégrles générlisées puisqu elles peuvent s écrire comme intégrles de fonctions continues sur [, c]. Preuve de l proposition B.42. L fonction ϕ étnt monotone dmet une limite à guche finie ou infinie en b que nous notons ϕ(b ). En rison de l continuité et de l monotonie de ϕ sur [, b[, stricte u voisinge de b, ϕ([, b[) est l intervlle de bornes ϕ() et ϕ(b ), fermé en ϕ() et ouvert en ϕ(b ). Nous tritons le cs où ϕ est décroissnte, l dpttion u cs où elle est croissnte étnt immédite. On lors ϕ([, b[) =]ϕ(b ), ϕ()]. Pr ppliction de l prop. A.32 iii), on x [, b[, x f ( ϕ(t) ) ϕ (t) dt = ϕ(x) f(s) ds = ϕ() ϕ() ϕ(x) f(s) ds. (B.31) Les fonctions h et f étnt continues l une sur [, b[ et l utre sur ]ϕ(b ), ϕ()] pprtiennent respectivement à R loc [, b[ et R loc ]ϕ(b ), ϕ()]. En fisnt tendre x vers b dns (B.31), et en notnt que pr continuité et décroissnce de ϕ, ϕ(x) tend lors vers ϕ(b ) pr l droite, on voit que les intégrles générlisées b h(t) dt et ϕ(b ) f(s) ds ϕ() sont de même nture. Si l une des deux converge, on en déduit en se souvennt de l définition B.11 : b f ( ϕ(t) ) ϕ() ϕ (t) dt = f(s) ds = ϕ(b ) ϕ(b ) ϕ() f(s) ds, ce qui nous donne (B.3). D utre prt si f est positive, h est négtive cr ϕ est décroissnte donc ϕ. Alors dns (B.31) les intégrles x h(t) dt et ϕ() f(s) ds sont des ϕ(x) fonctions négtives et décroissntes de x donc convergent dns R qund x tend vers b, soit vers un réel négtif, soit vers et l églité (B.31) se conserve pr pssge à l limite. Si f est négtive, h est positive cr ϕ. Alors les intégrles de (B.31) sont des fonctions positives et croissntes de l vrible x et elles restent égles à l limite (dns R + ) qund x tend vers b. Exemple B.43. L intégrle générlisée I := + sin(t 2 ) dt converge 13. En effet pr le chngement de vrible croissnt et C 1, ϕ : t t 2, l intervlle [, + [ pour imge [, + [ et I est de même nture que J := + sin s 2 s ds. L intégrle J converge pr l proposition B.27, donc I converge. De plus on lors I = J pr l églité (B.3). 13. Je sis, cel surprend, surtout si on compre vec l exemple B.3. 264 Ch. Suquet, Cours I.P.É. 21
B.4. Divers Exemple B.44 (un chngement de vrible illicite). Voici un exemple où un chngement de vrible C 1 non monotone ppliqué sns précution conduit à une erreur. Dns l intégrle générlisée I := 2π sin t dt, on pose s = cos t. On obtient lors l intégrle cos t de Riemnn ordinire J := 1 ds =. L églité I = J ne peut être vlide ici cr I 1 s diverge. En effet l fonction tngente est loclement Riemnn intégrble sur l intervlle troué [, 2π] \ {π/2, 3π/2} et nous devons considérer séprément chcune des intégrles π/2, 3π/2 et 2π. L intégrle π/2 tn t dt diverge cr l fonction tngente est positive sur [, π/2[ et équivlente à 1/ cos t u voisinge à guche de π/2. Or on sit pr π/2 3π/2 l exemple B.38 que π/2 dt diverge 14. cos t B.4.2 Intégrtion pr prties Il n y ps d extension utomtique de l règle d intégrtion pr prties (i.p.p.) des intégrles de Riemnn ordinires (clculbles pr primitivtion) ux intégrles générlisées. Lorsque l on effectue une intégrtion pr prties sur une intégrle générlisée, tout peut rriver : 1. trnsformtion d une intégrle bsolument convergente en intégrle bsolument convergente ; 2. trnsformtion d une intégrle bsolument convergente en intégrle convergente mis ps bsolument et vice vers ; 3. trnsformtion d une intégrle bsolument convergente en intégrle divergente. En prtique pour effectuer une intégrtion pr prties sur b f(t) dt vec f Rloc [, b[ (en fit vec f C[, b[), on l effectue d bord sur l intégrle de Riemnn ordinire x f(t) dt pour x quelconque dns [, b[ vnt de regrder ce qui se psse lorsque l on fit tendre x vers b. Voici quelques exemples illustrnt les différentes situtions possibles. Exemple B.45. Clcul de I := + te t dt pr i.p.p. L intégrnde est une fonction positive et continue sur [, + [. Comme te t/2 tend vers en +, cette quntité est mjorée pour t t pr une constnte M. On lors pour t t, te t Me t/2 =: g(t) et comme + g(t) dt converge (évident pr primitivtion), le théorème de comprison (th. B.29) nous donne l convergence de I. On effectue l i.p.p. sur I(x) := x te t dt en posnt u(t) = t, v (t) = e t, u (t) = 1, v(t) = e t, d où x [, + [, I(x) = [ te t] x x ( e t ) dt = xe x + x e t dt. 14. On pourrit contester cet exemple, cr dns le contexte de l proposition B.42, vnt d envisger un chngement de vrible dns l intégrle I, il convient de vérifier que l intégrnde est loclement intégrble sur [, 2π[, ce qui n est ps le cs ici. Ch. Suquet, Cours I.P.É. 21 265
Annexe B. Intégrle générlisée Qund x tend vers +, xe x tend vers et x e t dt tend vers l intégrle générlisée convergente + e t dt, lquelle se clcule d illeurs imméditement pr primitivtion (exemple B.1) et vut 1. Finlement l i.p.p. nous permet ici de retrouver l convergence de I et de clculer s vleur : I = 1. Exemple B.46. Intégrtion pr prties de I := + π sin 2 t dt. Ici l intégrnde f est loclement Riemnn intégrble sur [π, + [, comme fonction continue sur cet intervlle. L convergence de I résulte de l inéglité f(t) t 2 et de l convergence de + t 2 dt, pr le théorème de comprison. Ainsi I est une intégrle π générlisée bsolument convergente. On effectue l i.p.p. sur I(x) := x f(t) dt en posnt u(t) = sin 2 t, v (t) = t 2, u (t) = 2 sin t cos t = sin(2t), v(t) = t 1, ce qui nous donne x π, I(x) = [ ] x sin2 t x sin(2t) + dt = sin2 x 2x sin s + ds. t π π t x 2π s Fisons tendre x vers +, lors u premier membre I(x) tend vers I puisque l on sit déjà que I converge. Au second membre x 1 sin 2 x tend vers. On en déduit que J(x) := 2x 2π s 1 sin s ds tend vers une limite finie égle à I. Ceci prouve que l intégrle générlisée J := + 2π converge et est égle à I. On sit pr illeurs que J n est ps bsolument convergente, voir l exemple B.28. Ici l intégrtion pr prties trnsformé une intégrle bsolument convergente I en une intégrle J convergente mis ps bsolument. Une utre i.p.p. prtnt de J donnerit J = 1 + 2π + cos s ds, 2π s 2 nous fournissnt un exemple de trnsformtion d une intégrle convergente mis ps bsolument, en intégrle bsolument convergente. sin s s π/2 sin t Exemple B.47. Tenttive d i.p.p. sur I := dt t3/2 L intégrnde f est dns R loc ], π/2] et positive. L intégrle converge en grâce à l mjortion sin t t d où f(t) t 1/2 vlble pour tout t ], π/2]. L intégrle générlisée I est donc bsolument convergente. Intégrons pr prties I(x) := π/2 f(t) dt x en posnt : u(t) = t 3/2, v (t) = sin t, u (t) = 3 2 t 5/2, v(t) = cos t, ds t 2 266 Ch. Suquet, Cours I.P.É. 21
B.4. Divers d où [ cos t I(x) = t 3/2 ] π/2 x 3 2 π/2 x cos t cos x dt = t5/2 x 3 π/2 3/2 2 x cos t dt. t5/2 Si on fit tendre x vers +, on obtient une forme indéterminée du type, cr l intégrle générlisée π/2 cos t J := dt t5/2 est divergente et vut + (justifiez!). On là un exemple d une intégrtion pr prties sur une intégrle bsolument convergente qui fit pprître une intégrle divergente. Ceci dit l i.p.p. ci-dessus n est ps complètement inutile. Elle permet en effet de donner une «vitesse de divergence» de J. En effet puisque I(x) une limite finie I en +, on en déduit que B.4.3 J(x) = π/2 x cos t t 5/2 dt + 2 cos x 3x 3/2 + 2 3x 3/2. Comprison des intégrles ordinires et générlisées On exmine mintennt quelles sont les propriétés de l intégrle de Riemnn ordinire qui pssent à l intégrle générlisées. L intégrle générlisée hérite des propriétés suivntes de l intégrle de Riemnn ordinire, à condition de remplcer l hypothèse «f, g R[, b]» pr «f, g R loc [, b[ et les intégrles générlisées b f(t) dt et b g(t) dt convergent». Nous lissons le soin u lecteur de vérifier ces propriétés en les ppliqunt d bord à x vnt de fire tendre x vers b. Additivité, voir prop. A.18. Linérité, voir prop. A.2. Positivité et croissnce, voir les points i) et ii) de l proposition A.21. L dditivité reltive ux intervlles, cf. prop. A.28 en notnt que l convergence de b f(t) dt implique celle de c f(t) dt et de b f(t) dt, pour tout c ], b[. c L reltion de Chsles prop. A.29, à condition que chcune des trois intégrles concernées soit convergente. En effet en prennt c extérieur à [, b[, on risque de fire pprître une intégrle divergente. Voyons mintennt les propriétés qui ne pssent ps de l intégrle ordinire à l intégrle générlisée. Il s git essentiellement de ce qui concerne l vleur bsolue et le produit. Rppelons d bord que l Riemnn intégrbilité de f implique celle de f et que l réciproque est fusse, cf. remrque A.23. On en déduit imméditement que si f est loclement Riemnn intégrble sur [, b[, f l est ussi. Pr contre pour f R loc [, b[, l convergence de l intégrle générlisée b f(t) dt n implique ps celle de b f (t) dt, voir l exemple B.28. Dns le même ordre d idées, l Riemnn intégrbilité locle de f sur [, b[ implique celle de f + et de f, mis l convergence de b f(t) dt n implique ps celle de b f + (t) dt et b f (t) dt. L exemple B.28 vec f(t) = t 1 sin t sert ussi de Ch. Suquet, Cours I.P.É. 21 267
Annexe B. Intégrle générlisée contre exemple ici (vérifiction lissée en exercice). Pr contre si b f(t) dt est bsolument convergente, b f + (t) dt et b f (t) dt sont convergentes et on b insi que f (t) dt = b f + (t) dt + b b f (t) dt, f(t) dt b b f(t) dt = b f(t) dt < +. f + (t) dt b f (t) dt, (B.32) Regrdons mintennt le produit. Si f, g R loc [, b[, il découle imméditement de l proposition A.26 que leur produit fg est lui ussi dns R loc [, b[. Pr contre, l convergence, même bsolue, des intégrles générlisées b f(t) dt et b g(t) dt n implique ps celle de b f(t)g(t) dt. Un contre exemple immédit est vec [, b[= [, 1[, f(t) = g(t) = (1 t) 1/2. On peut nénmoins obtenir l convergence de b f(t)g(t) dt à prtir de celle des intégrles générlisées non ps de f et g mis de f 2 et g 2. Proposition B.48 (inéglité de Cuchy-Schwrz). Si f, g R loc [, b[ sont telles que b f(t)2 dt et b g(t)2 dt convergent, b f(t)g(t) dt converge bsolument et vérifie b { b f(t)g(t) dt } 1/2 { b 1/2 f(t) 2 dt g(t) dt} 2. (B.33) Preuve. D bord, puisque f, g sont dns R loc [, b[, il en v de même pour f, g et leur produit f g = fg. En ppliqunt l inéglité de Cuchy Schwrz pour les intégrles ordinires, on en déduit que x [, b[, x { x f(t)g(t) dt } 1/2 { x 1/2 f(t) 2 dt g(t) dt} 2. Toutes ces intégrles sont des fonctions croissntes de x. En fisnt tendre x vers b, elles convergent toutes dns R +. Compte tenu de l hypothèse convergence de b f(t)2 dt et b g(t)2 dt, on en déduit que b { b f(t)g(t) dt } 1/2 { b 1/2 f(t) 2 dt g(t) dt} 2 < +. Ceci montre que b f(t)g(t) dt converge bsolument et on conclut en ppliqunt l inéglité (B.32) à l fonction fg. 268 Ch. Suquet, Cours I.P.É. 21
Tble des vleurs de Φ, f.d.r. de l loi normle stndrd N(, 1) y Φ(x) x t x..1.2.3.4.5.6.7.8.9..5.54.58.512.516.5199.5239.5279.5319.5359.1.5398.5438.5478.5517.5557.5596.5636.5675.5714.5754.2.5793.5832.5871.591.5948.5987.626.664.613.6141.3.6179.6217.6255.6293.6331.6368.646.6443.648.6517.4.6554.6591.6627.6664.67.6736.6772.688.6844.6879.5.6915.695.6985.719.754.788.7122.7156.719.7224.6.7257.7291.7324.7356.7389.7421.7454.7486.7517.7549.7.758.7611.7642.7673.773.7734.7764.7793.7823.7852.8.7881.791.7939.7967.7995.823.851.879.816.8133.9.8159.8186.8212.8238.8264.8289.8315.834.8365.8389 1..8414.8438.8461,8485.858.8531.8554.8577.8599.8622 1.1.8643.8665.8687.878.8729.8749.877.879.881,883 1.2.8849.8869.8888.897.8925.8944.8962.898.8997.915 1.3.932.949.966.983.999.9115.9131.9147.9162.9177 1.4.9193.927.9222.9236.9251.9265.9279.9292.936.9319 1.5.9332.9345.9357.937.9382.9394.946.9418.9429.9441 1.6.9452.9463.9474.9485.9495.955.9515.9525.9535.9545 1.7.9554.9564.9573.9582.9591.9599.968.9616.9625.9633 1.8.9641.9648.9656.9664.9671.9678.9686.9693.9699.976 1.9.9713.9719.9726.9732.9738.9744.975.9756.9761.9767 2..9772.9778.9783.9788.9793.9798.983.988.9812.9817 2.1.9821.9826.983.9834.9838.9842.9846.985.9854.9857 2.2.9861.9864.9868.9871.9874.9878.9881.9884.9887.989 2.3.9893.9895.9898.991.993.996.999.9911.9913.9916 2.4.9918.992.9922.9924.9926.9928.993.9932.9934.9936 2.5.9938.994.9941.9943.9944.9946.9948.9949,9951.9952 2.6.9953.9955.9956.9957.9958.996.9961.9962.9963.9964 2.7.9965.9966.9967.9968.9969.997.9971.9972.9973.9974 2.8.9974.9975.9976.9977.9977.9978.9979.9979.998.9981 2.9.9981.9982.9982.9983.9984.9984.9985.9985.9986.9986 Tble pour les grndes vleurs de x x 3. 3.1 3.2 3.3 3.4 3.5 3.6 3.8 4. 4.5 Φ(x).99865.9994.99931.99952.99966.99976.999841.999928.999968.999997
L tble donne les vleurs de Φ(x) pour x positif. Lorsque x est négtif, on utilise l reltion y Φ(x) = 1 Φ( x) qui résulte de l prité de l densité gussienne N(, 1). Exemple : pour x = 1, 8, on trouve : Φ(x) = 1, 9641 =, 359. x x t Pour les «très grndes vleurs de x», (i.e. x 4), on dispose du résultt suivnt qui donne une évlution de l «queue» de l loi normle. Pour tout x >, on l encdrement : ( 1 x 1 ) ) 1 exp ( x2 < 1 Φ(x) < 1 ) 1 exp ( x2. x 3 2π 2 x 2π 2
Index bsence de mémoire, 122 dditivité d une mesure, 51 de l espérnce, 151 de l intégrle de Riemnn, 226 iguille de Buffon, 28 ire, 56, 216 lgébrique, 233 d hypogrphe, 218, 233 et intégrle de Riemnn, 218 rrngement, 12 Byes (formule de), 81 Beppo Levi (théorème de), 141 bijection, 8 réciproque, 8 borélien, 53 Borel Cntelli, 194, 195 Buffon (iguille de), 28 crdinl, 8, 16 d un produit crtésien, 1 coefficient de corréltion, 172 coefficients binomiux, 13 multinomiux, 15 combinison, 12 complémentire, 6 conditionnement pr les cs possibles, 8 conditionnements successifs, 8 continuité monotone séquentielle, 63 convergence dominée, 22 en moyenne d ordre p, 199, 2 en probbilité, 196, 197, 22 presque complète, 196 presque sûre, 192, 193, 196, 198 convergence en loi binomile vers Poisson, 112 hypergéométrique vers binomile, 19 convolution de deux densités, 185 corréltion, 172 covrince, 171 chngement d échelle, 171 de v.. indépendntes, 189 formule de Koenig, 172 formules de clcul, 172 trnsltion, 171 critère de Cuchy, 251 fmille sommble, 41 intégrles générlisées, 252 séries, 25 croissnce d une mesure, 51 de l espérnce, 136, 152 de l intégrle de Riemmnn, 228 dénombrbilité, 16 d un produit crtésien, 18 d une union, 22 de N 2, 17 de N d, Z d, 19 de Q, 19 de Z, 16 et fmille sommble, 38 pr imge surjective, 23 dénombrble, 16 densité mrginle, 166 somme de v..r. indépendntes, 185 vecteur létoire, 165 vecteur létoire imge, 17 271
densité de probbilité sur R, 12 sur R d, 165 dydique (nombre), 21 écrt type, 158 ensemble u plus dénombrble, 16 dénombrble, 16 fini, 8 épreuves indépendntes, 88 équiprobbilité, 7 espce de Bnch, 25 espérnce croissnce, 136 d une constnte positive, 132 d une indictrice, 132 d une v.. discrète, 15 d une v.. discrète positive, 145 d une v.. positive, 13 d une v.. positive à densité, 135 d une v.. positive simple, 134 d une v.. réelle, 147 d une v.. réelle à densité, 148 interversion série-espérnce, 144 linérité, 151 produit de v.. indépendntes, 187 fmille sommble, 35 bsolument, 43 combinison linéire, 36 critère de Cuchy, 41 normlement, 43 permuttion d indices, 36 sommtion pr pquets, 44, 45 fonction bsolument continue, 13 convexe, 199 en esclier, 219 loclement Riemnn intégrble, 245 réglée, 225 Riemnn intégrble, 214 fonction de réprtition d une probbilité sur R, 72 d une v.. discrète, 1 d une vrible létoire, 99 fonction de survie, 122 formule de Byes, 81 de Koenig covrince, 172 vrince, 158 des ccroissements finis, 222 du binôme, 15 du multinôme, 13 hypogrphe, 218 i.i.d., 26 inclusion, 6 indépendnce conservtion pr complémentire, 87 covrince, 189 d une suite d évènements, 88 d une suite de v.., 178 de n vribles létoires, 173 de n vecteurs létoires, 174 de deux évènements, 85 de sous-tribus, 177 des composntes (cs à densité), 179 des composntes (cs discret), 178 deux à deux, 87 espérnce de produits, 186 hérédité, 175 mutuelle, 87 somme de v.., 183, 185 indictrice, 11 dns formules explicites, 12 inéglité de Bienymé-Tchebycheff, 25 inéglité de Cuchy-Schwrz espérnce, 171 intégrle de Riemnn, 231 intégrle générlisée, 268 inéglité de Mrkov, 137 vec moment, 153 injection, 7 intégrbilité 272
d une v.. discrète, 15 d une v.. réelle, 146 d une v.. réelle à densité, 148 intégrble vrible létoire positive, 132 vrible létoire réelle, 146 intégrle de Riemnn dditivité, 226 chngement de vrible, 235, 236 croissnce, 228 de à b ( > b), 216 et primitive, 222 inférieure, 214 linérité, 228 positivité, 228 reltion de Chsles, 232 supérieure, 214 sur [, b] ( < b), 214 intégrle générlisée, 245 bsolument convergente, 253, 254, 258 dditivité, 267 chngement de vrible, 262, 263 comprison, 257 convergente, 246 critère d Abel, 254 critère de Cuchy, 252 croissnce, 267 divergente, 246 équivlents, 258, 261 inéglité de Cuchy-Schwrz, 268 linérité, 267 positivité, 267 produit, 268 reltion de Chsles, 267 intégrle indéfinie, 234 intersection, 6 intervlle troué, 245 interversion limite espérnce, 141, 22 limite intégrle, 238, 239 produit espérnce, 187 série espérnce, 144 inverse ensembliste, 94 jcobien, 17 lemme Borel Cntelli, 194, 195 loi à densité, 12 binomile, 88, 17 conditionnelle, 97 continue, 11 d un vecteur létoire, 162 d une vrible létoire discrète, 97 d une vrible létoire réelle, 96 de Bernoulli, 17 de Cuchy, 125 de Poisson, 111, 184 diffuse, 11 discrète sur R, 97 exponentielle, 121 géométrique, 111 gussienne N(m, σ), 124 hypergéométrique, 18 mrginle (vecteur létoire), 162 multinomile, 164 normle, 124 tbles, 269 somme de v.. discrètes, 183 indépendntes, 183 uniforme sur un borélien de R d, 72 uniforme sur un ensemble fini, 17 uniforme sur un segment, 71 loi fible des grnds nombres, 25 loi forte des grnds nombres, 26 msse de Dirc, 54 mesurble (ppliction), 93 mesure, 52 ire, 56 de comptge, 55 de Dirc, 54 de Lebesgue sur R d, 56 longueur, 56 ponctuelle, 55 propriétés, 67 série de mesures, 54 273
volume, 56 moment, 152 h-moment d une v.., 152 bsolu, 152 d une v.. à densité, 154 d une v.. discrète, 153 fonctionnel, 152 n-uplet, 7 non dénombrbilité de P(N), [, 1], R, C, 2 de {, 1} N, 19 prtie négtive (d un réel), 31 prtie positive (d un réel), 31 prtition, 8 permuttion, 12 primitive, 222 probbilité conditionnelle, 77 d un intervlle, 74 produit, 176 probbilités des cuses, 81 totles (formule des), 8 produit de fonctions, 179 produit de probbilités, 176 produit crtésien, 6 quntificteurs, 6, 192 réunion, 6 Riemnn intégrbilité, 214 d un produit, 23 de f, 228 de f + et f, 23 locle, 245 pr convergence uniforme, 224 Riemnn intégrbilité de f bornée continue pr morceux, 223 continue, 222 en esclier, 22 monotone, 221 réglée, 225 semi norme, 23 série, 24 bsolument convergente, 25 lternée, 28 commuttivement convergente, 29 convergence normle, 25 de Bertrnd, 27 de Riemnn, 27 double, 46 géométrique, 25 hrmonique, 24 produit, 49 reste (série convergente), 24 somme prtielle, 24 vectorielle, 24 série double, 46 interversion des sommtions, 48 σ-dditivité, 52 σ-lgèbre, 52 sommtion pr pquets, 44 dns R +, 45 sommes de Drboux, 213 subdivision de [, b], 213 surjection, 7 et dénombrbilité, 23 temps d ttente, 11 théorème bsence de mémoire, 122 crctéristion probbilités sur R, 75 comprison série intégrle, 26 comprison séries à termes positifs, 26 de B. Levi, 141 de convergence dominée, 22 des séries lternées, 28 interversion des séries doubles, 48 règle des équivlents (séries), 26 série produit, 49 sommtion pr pquets, 44 sommtion pr pquets dns R +, 45 tribu, 52 borélienne, 53 engendrée, 53 engendrée pr une ppliction, 177 produit, 176 274
sous-tribu, 177 vrible létoire étgée, 133 de Rdemcher, 147 discrète, 95 positive, 13 positive intégrble, 132 réelle, 95 réelle intégrble, 146 simple, 133 vrince, 158 chngement d échelle, 159 d une somme, 172 formule de Koenig, 158 trnsltion, 159 vecteur létoire, 162 à densité, 165 discret, 164 lois mrginles, 162 275