Cours Intégration MA62. Université de Reims



Documents pareils
Intégration et probabilités TD1 Espaces mesurés Corrigé

Intégration et probabilités TD1 Espaces mesurés

Théorie de la Mesure et Intégration

Théorie de la mesure. S. Nicolay

Théorie de la Mesure et Intégration

Intégrale de Lebesgue

La mesure de Lebesgue sur la droite réelle

THÉORIE DE LA MESURE ET DE L INTÉGRATION.

Image d un intervalle par une fonction continue

Limites finies en un point

Mesure et Intégration (Notes de cours de L3)

Université Paris-Dauphine DUMI2E 1ère année, Applications

Mesures et Intégration

Calcul fonctionnel holomorphe dans les algèbres de Banach

Continuité en un point

Dualité dans les espaces de Lebesgue et mesures de Radon finies

Développement décimal d un réel

Moments des variables aléatoires réelles

Suites numériques 3. 1 Convergence et limite d une suite

* très facile ** facile *** difficulté moyenne **** difficile ***** très difficile I : Incontournable T : pour travailler et mémoriser le cours

Construction de l'intégrale de Lebesgue

Le produit semi-direct

De même, le périmètre P d un cercle de rayon 1 vaut P = 2π (par définition de π). Mais, on peut démontrer (difficilement!) que

3. Conditionnement P (B)

Théorème du point fixe - Théorème de l inversion locale

Fonctions de plusieurs variables, intégrales multiples, et intégrales dépendant d un paramètre

MESURE ET INTÉGRATION EN UNE DIMENSION. Notes de cours

Chapitre 2 Le problème de l unicité des solutions

Cours de mathématiques

PROBABILITÉS: COURS DE LICENCE DE MATHÉMATIQUES APPLIQUÉES LM 390

Problèmes de Mathématiques Filtres et ultrafiltres

Programmes des classes préparatoires aux Grandes Ecoles

Continuité d une fonction de plusieurs variables

MA6.06 : Mesure et Probabilités

Intégration sur des espaces produits

Capes Première épreuve

CHAPITRE IV. L axiome du choix

3 Approximation de solutions d équations

n N = u N u N+1 1 u pour u 1. f ( uv 1) v N+1 v N v t

4. Martingales à temps discret

I. Polynômes de Tchebychev

Espérance conditionnelle

Exercices - Polynômes : corrigé. Opérations sur les polynômes

Cours de Probabilités et de Statistique

Optimisation non linéaire Irène Charon, Olivier Hudry École nationale supérieure des télécommunications

Produits d espaces mesurés

Mesures gaussiennes et espaces de Fock

Probabilités sur un univers fini

Cours d Analyse. Fonctions de plusieurs variables

Chapitre 3. Quelques fonctions usuelles. 1 Fonctions logarithme et exponentielle. 1.1 La fonction logarithme

Simulation de variables aléatoires

Filtrage stochastique non linéaire par la théorie de représentation des martingales


1 Définition et premières propriétés des congruences

Approximations variationelles des EDP Notes du Cours de M2

CCP PSI Mathématiques 1 : un corrigé

Souad EL Bernoussi. Groupe d Analyse Numérique et Optimisation Rabat http ://

Séminaire TEST. 1 Présentation du sujet. October 18th, 2013

Fonctions de plusieurs variables

Groupe symétrique. Chapitre II. 1 Définitions et généralités

Premiers exercices d Algèbre. Anne-Marie Simon

Exercices - Fonctions de plusieurs variables : corrigé. Pour commencer

Amphi 3: Espaces complets - Applications linéaires continues

Correction de l examen de la première session

Chapitre 7 : Intégration sur un intervalle quelconque

Calcul différentiel sur R n Première partie

Tests non-paramétriques de non-effet et d adéquation pour des covariables fonctionnelles

Introduction à l étude des Corps Finis

Calcul matriciel. Définition 1 Une matrice de format (m,n) est un tableau rectangulaire de mn éléments, rangés en m lignes et n colonnes.

1 Mesure et intégrale

Relation d ordre. Manipulation des relations d ordre. Lycée Pierre de Fermat 2012/2013 Feuille d exercices

Exercice autour de densité, fonction de répatition, espérance et variance de variables quelconques.

Structures algébriques

Calcul différentiel. Chapitre Différentiabilité

Corps des nombres complexes, J Paul Tsasa

Cours3. Applications continues et homéomorphismes. 1 Rappel sur les images réciproques

Chapitre 2. Eléments pour comprendre un énoncé

TIQUE DE FRANCE NILSYSTÈMES D ORDRE 2 ET PARALLÉLÉPIPÈDES

Première partie. Préliminaires : noyaux itérés. MPSI B 6 juin 2015

Un K-espace vectoriel est un ensemble non vide E muni : d une loi de composition interne, c est-à-dire d une application de E E dans E : E E E

Chp. 4. Minimisation d une fonction d une variable

Probabilités sur un univers fini

Exemple 4.4. Continuons l exemple précédent. Maintenant on travaille sur les quaternions et on a alors les décompositions

Logique. Plan du chapitre

Suites numériques 4. 1 Autres recettes pour calculer les limites

Axiomatique de N, construction de Z

FONCTIONS DE PLUSIEURS VARIABLES (Outils Mathématiques 4)

Objets Combinatoires élementaires

Probabilités. C. Charignon. I Cours 3

Texte Agrégation limitée par diffusion interne

Sur certaines séries entières particulières

Comparaison de fonctions Développements limités. Chapitre 10

Calculs de probabilités

Le modèle de Black et Scholes

Planche n o 22. Fonctions de plusieurs variables. Corrigé

Rappels sur les suites - Algorithme

I. Ensemble de définition d'une fonction

Continuité et dérivabilité d une fonction

Programmation linéaire et Optimisation. Didier Smets

Proposition. Si G est un groupe simple d ordre 60 alors G est isomorphe à A 5.

Transcription:

Cours Intégration MA62 Frédéric Hérau Université de Reims mai 2006

Table des matières Introduction 2 1 Préliminaires et Rappels 3 1.1 La droite achevée R............................... 3 1.2 Rappels sur les fonctions réelles......................... 5 1.3 Dénombrabilité.................................. 6 2 Tribus et applications mesurables 8 2.1 Tribus, espaces mesurables............................ 8 2.2 Applications mesurables............................. 11 2.3 Structure des fonctions mesurables....................... 14 3 Mesures et intégration 16 3.1 Mesures...................................... 16 3.2 Intégration des fonctions positives....................... 20 4 Théorèmes de convergence et fonctions intégrables 26 4.1 Théorèmes de convergence............................ 26 4.2 Fonctions Intégrables et ensembles de mesure nulle.............. 31 5 La mesure de Lebesgue sur R 36 5.1 Un théorème de prolongement.......................... 36 5.2 La mesure de Lebesgue sur R.......................... 38 5.3 Intégrale de Riemann et intégrale de Lebesgue................ 40 6 Espaces de fonctions intégrables 42 6.1 Les espace L p................................... 42 6.2 Intégrales dépendant d un paramètre...................... 50 7 Produit d espaces mesurés 53 7.1 Produit d espaces mesurables........................... 53 7.2 Mesure produit, Théorème de Fubini...................... 55 7.3 Changements de variables et intégration.................... 58 1

Introduction Ce cours est la version écrite d un cours donné partiellement ou en totalité entre 2003 et 2006 à l Université de Reims. Il correspond à 24H de présence devant les étudiants. A l issue de ce cours, les étudiants doivent avoir acquis quelques automatismes d utilisation de l Intégrale de Lebesgue, en particulier l utilisation des Théorèmes fondamentaux suivant : Les Théorèmes de convergence dominée et de convergence monotone, les Théorèmes de Fubini-Tonelli et de Fubini. Cet objectif ne doit pas être abandonné sous prétexte de difficultés passagères à comprendre le cours. En fait la théorie est difficile mais l usage de l intégrale de Lebesgue (1906) est relativement facile. Pour l intégrale de Riemann par contre, les théorèmes d application nécessitent souvent des hypothèses fortes, par exemple de convergence uniforme. Intégrale de Lebesgue Théorie difficile, usage facile Intégrale de Riemann Théorie facile, usage délicat L utilisation du cours est relativement simple. Les Théorèmes, Propositions, Définitions, et Propriétés vus au fil des chapitres sont à connaître. Les Remarques, Lemmes (résultats intermédiaires) ne sont pas à retenir par coeur. Par manque de temps, la construction de l intégrale ne sera que partiellement abordée en cours. Toute remarque sur d éventuelles coquilles ou erreurs est bienvenue. Je tiens à remercier G. Henriet pour m avoir fourni une première version dactylographiée de la seconde partie. Voici ci-dessous une liste quelques documents et livres dont je me suis servi pour l élaboration de ce cours. Les documents en ligne sont accessibles par moteur de recherche (auteur + intégration sous google par exemple) : [1] Bourdarias, C. Intégration et Applications, Université de Savoie, dispo. en ligne, 2000. [2] Faraut, J. Calcul Intégral, Belin, 2000. [3] Gapaillard, J. Intégration pour la Licence, cours et exercices corrigés, Dunod, 2002. [4] Lerner, N. Cours d intégration, Université de Rennes 1, dispo. en ligne, 2002 [5] Revuz, D. Mesure et Intégration, Hermann, collection Méthodes, 1997. [6] Rudin, W. Real and complex analysis, McGraw-Hill, New-York, 1987. 2

Chapitre 1 Préliminaires et Rappels Dans tout ce chapitre X désigne un ensemble quelconque. 1.1 La droite achevée R Une suite réelle n a pas toujours de valeur d adhérence. Ceci est du au fait que R,. n est pas compact. En ajoutant deux éléments à R on peut en faire un espace compact. Définition 1.1.1 On appelle droite achevée l espace topologique noté R obtenu en adjoignant à R deux éléments, notés + et. La topologie de R est alors engendrée par les ouverts de R et les ensembles ]a, + [ {+ }, { } ], a[ (que l on notera respectivement ]a, + [ et [, a[). On définit de manière similaire R + en adjoignant à R + l élément +. La relation d ordre sur R s étend à R en considérant comme plus petit élément et + comme plus grand élément. Cet ordre est compatible avec la topologie puisque les ouverts sont comme pour R des réunions d intervalles. L espace R jouit des propriétés suivantes faciles à vérifier i) R est compacte. En particulier toute partie non vide possède une borne sup et une borne inf. ii) R est homéomorphe à [0, 1]. Il suffit pour cela de par exemple prolonger la fonction tan à l intervalle [ π/2, π/2] et la fonction arctan à [, + ]. (on rappelle que [0, 1] et [ π/2, π/2] sont homéomorphes : une simple application affine envoie continûment l un sur l autre). On peut également remarquer que cet homéomorphisme peut être pris croissant. iii) Toute suite monotone de R est convergente. Nous venons de voir que l ordre de R était compatible avec celui de R. Les opérations usuelles le sont aussi sous les conditions naturelles suivantes : soit x R x + (± ) = (± ), x (± ) = (± ) si x > 0, ( ) sinon. On laisse au lecteur les autres opérations naturelles, dont sont bien sur exclues (+ ) + ( ) et 0 (± ). En fait la bonne manière de considérer ces calculs est de considérer 3

le prolongement par continuité de l addition et de la multiplication a R R (privé des cas exclus ci dessus). Mentionnons dès maintenant que par convention, nous poserons systématiquement dans la suite 0 = 0. Une conséquence du fait que R soit compact est en particulier que l ensemble des valeurs d adhérence d une suite n est pas vide (on rappelle que l ensemble des valeur d adhérence Adh(u) d une suite (u n ) est l ensemble des limites des sous-suites de (u n ) qui convergent). On introduit maintenant les limites inférieures et supérieures des suites réelles. Définition 1.1.2 Soit (u n ) n N une suite de R. On définit les suites (inf k n u k ) n N et ( ) supk n u k. Ces suites sont clairement monotones donc convergentes dans R (la n N première croît et la seconde décroît). On note alors On a alors la lim inf u n = lim (inf k n u k ) = sup (inf k n u k ) lim sup u n = lim ( sup k n u k ) = inf (infk n u k ) Proposition 1.1.3 Soit (u n ) n N une suite de R. Alors lim inf u n (resp lim sup u n ) est la plus petite (resp. la plus grande) valeur d adhérence de la suite. On a lim inf u n lim sup u n et l égalité a lieu si et seulement si la suite converge vers cette valeur Preuve. Avant de commencer rappelons que la limite si elle existe peut-être ± puisque nous travaillons dans R. Considérons donc x R une valeur d adhérence de la suite. Alors il existe une suite extraite (u nk ) k N de (u n ) qui converge vers x, et on a pour k tendant vers l infini x u nk sup u l lim sup u n. l n k La limite à droite provient simplement du fait que la suite de terme général sup l nk u l est une suite extraite de la suite ( sup l n u l ) qui, par définition, converge vers lim sup un. On a donc montré que y lim sup u n et on aurait de même y lim inf u n. Pour montrer que l = lim sup u n est une valeur d adhérence, on va se restreindre au cas où < l < i.e. l R. La preuve dans le cas l = ± est tout à fait semblable. On note (v n ) la suite sup n k u k qui converge donc en décroissant vers l. Alors pour tout ε > 0, et n 0 il existe n ε n tel que l v nε l + ε. Mais par ailleurs, v nε étant un sup, il existe n ε n ε tel que v n ε ε u n ε v n ε d où l on déduit l ε v n ε ε u n ε v n ε l + ε. En résumé on a montré que pour tout ε > 0 et tout N N il existe n(= n ε ici) tel que u n l ε. l est donc une valeur d adhérence de (u n ). Pour finir, si lim inf u n et lim sup u n sont toutes les deux égales à l R, alors pour n tendant vers l infini l inf u k u n sup u k l, k n ce qui prouve le résultat. Un autre résultat qui sera utile dans le cours concerne les sommes doubles dans R. On note R + = [0, + ]. k n 4

Lemme 1.1.4 Soit (u j,k ) une suite double de R +. Alors ( ) u j,k = u j,k. j k k j Cette somme est simplement notée j,k u j,k. Preuve. On sait déjà que pour j fixé la série k u j,k converge dans R puisque son terme général est positif. Pour la même raison la série j ( k u j,k) converge également, ce qui donne un sens aux séries de l énoncé. Maintenant pour J, K N on a u j,k = u j,k sup u j,k = u j,k sup u j,k = u j,k. j J k K k K j J k K J j J k K j K k K j k j Notons alors S = k j u j,k on vient de montrer que pour tout j, k, u j,k S, j J k K d où il vient en prenant le sup sur K à l intérieur de la somme finie, u j,k S, j J k puis en prenant le sup sur J, u j,k S. j k Par symétrie on obtient l inégalité dans l autre sens, le résultat est alors prouvé. 1.2 Rappels sur les fonctions réelles Soit X et Y deux ensembles, on désigne par F(X, Y ) l ensemble des fonctions de X dans Y. Lorsque Y = R ou R on définit naturellement pour f et g F(X, Y ) les fonctions inf(f, g) et sup(f, g). Par exemple les fonctions parties positives et négatives d une fonction sont les deux fonctions positives définies par f + : x sup(f, 0) et f : x sup( f, 0), pour lesquelles on a f = f + f. Pour une famille de fonctions (f n ) n N dans F(X, R) on a également sup n f n et inf n f n F(X, R). Il en va de même pour les fonctions lim sup f n et lim inf f n définies respectivement sur X par x lim sup f n (x) et x lim inf f n (x). Parmi les fonctions réelles certaines jouent un rôle important en théorie de l intégration, il s agit des fonctions indicatrices d ensemble. 5

Définition 1.2.1 Soit X un ensemble et A{ X. On appelle fonction indicatrice de A et 1 si x A on note 1 A la fonction définie par 1 A (x) = 0 sinon. { P(X) F(X, R) L application Φ : est injective et a les propriétés suivantes : A 1 A i) A B = 1 A 1 B ; ii) 1 A B = 1 A 1 B ; iii) 1 A B = sup(1 A, 1 B ) ( = 1 A + 1 B si A et B sont disjoints) ; iv) 1 A c = 1 1 A, ou on a noté A c le complémentaire dans X de A ; v) Si (A i ) i I est une partition de X, alors i 1 Ai = 1. Etant donnés deux ensemble A X, B Y, et une fonction f F(X, Y ), on rappelle les définitions d image et d image réciproque d ensemble : f(a) = {f(x); x A}, f 1 (B) = {x X tels que f(x) B}. (1.1) On prendra garde au fait que l emploi des notations f et f 1 ci-dessus constitue bien sur un abus d écriture : la fonction f n est pas définie sur les ensembles et la fonction f 1... n est a priori pas définie du tout! On a alors les propriétés suivantes dont la vérification est laissée au lecteur : B Y, f(f 1 (B)) B, avec égalité quand f est surjective ; A X, f 1 (f(a)) A, avec égalité quand f est injective ; B, B Y, f 1 (B B ) = f 1 (B) f 1 (B ) ; B, B Y, f 1 (B B ) = f 1 (B) f 1 (B ) ; B Y, f 1 (B c )) = (f 1 (B)) c. 1.3 Dénombrabilité La dénombrabilité est également au coeur des processus limites utilisés dans la théorie de l intégration de Lebesgue. On rappelle qu un ensemble D est dit fini ou dénombrable s il est équipotent à une partie de N, c est à dire s il existe une injection ϕ de D dans N. S il est fini il peut être mis en bijection avec un ensemble du type {1,..., n} où n est unique et est appelé nombre d éléments de D. S il est infini alors il est équipotent à N : en effet, on peut grace à l injection ϕ ci-dessus considérer D comme une partie de N, et poser d 1 = min D, d 2 = min(d/ {d 1 }),... d k = min(d/ {d 1,...d k 1 }). Cette définition a bien un sens puisque N est totalement ordonné et que toute partie non vide de N admet un plus petit élément. Il est alors clair que l application k d k constitue une bijection de N sur D. On rappelle ici quelques exemples fondamentaux d ensembles dénombrables : i) N, 2N, Z. Pour les 2 premiers par exemple on peut utiliser les application k k + 1 et resp. k 2k, qui sont des bijections de N sur N, resp. 2N. ii) N N, Q. Pour le premier il suffit de l application (p, q) N N 2 p (2q + 1) 1 N est une bijection. Le fait que Q s injecte dans N N implique alors que Q est dénombrable. On obtient facilemnet que Q n l est également. 6

On peut donner une application qui sera utile dans le chapitre suivant au fait que Q est dénombrable. Lemme 1.3.1 Soit d un entier. Il existe une famille dénombrable de pavés compacts de R d (produit d intervalle compacts) telle que tout ouvert soit réunion (nécessairement dénombrable) d une sous-famille de ces pavés. On peut choisir ces pavés comme produit d intervalles compacts d extrémités rationnelles. Preuve. Soit donc U un ouvert. Pour tout x = (x 1,...x d ) U, il existe un cube ouvert contenant x et contenu dans U puisque U est ouvert, { } y R d ; y j x j ρ U, pour un ρ non nul (c est dû par exemple à l équivalence des normes sur R d ). Comme Q est dense dans R, il existe p j et q j Q tels que x j ρ < p j < x j < q j < x j + ρ. Donc le compact j=1...d [p j, q j ] contient x et est contenu dans U. L ouvert U est donc réunion d une sous famille de la famille des pavés d extrémités rationnelles. Or cette famille est dénombrable, puisque équipotente à Q 2d qui est dénombrable. Cela complète la preuve. 7

Chapitre 2 Tribus et applications mesurables Le but de ce chapitre est de définir les objets que nous seront amenés à mesurer : les ensembles mesurables et les fonctions mesurables. De nouveau X est a priori un ensemble quelconque. 2.1 Tribus, espaces mesurables Définition 2.1.1 Soit X un ensemble et M une famille de parties de X. On dit que M est une tribu sur X si (a) A M = A c M, (b) (A n ) n N M = n N A n M, (c) X M. On insiste sur le fait que M n est pas une partie de X, c est une famille de parties. On remarque que la propriété (c) est une conséquence immédiate de (a) et (b), pourvu que M soit non vide. La propriété (b) est appelée stabilité par réunion dénombrable. Finalement, on peut remarquer que (b) implique qu une tribu et stable par intersection dénombrable. (b ) (A n ) n N M = n N A n M. Dans la définition d une tribu on peut remplacer (b) par (b ). Pour finir les axiomes (a) et (c) impliquent que (c ) M. On peut de même échanger (c) et (c ) dans la définition. Pour finir on peut remarquer que dans les axiomes d une topologie autre ensemble de parties fondamental en analyse dont la definition est rappelée en (2.1)) la dénombrabilité ne jouait pas ce rôle central. Ce rôle va se confirmer plus loin. Exemples 2.1.2 On peut donner déjà quelques exemples simples de tribus. 1. La tribu triviale : M = {, X} ; 2. La tribu grossière : M = P(X) ; 3. La tribu associée a une partition finie : Si (A i ) i 1,...,n est une partition finie, alors M = { k J A k ; J {1,..., n}} 8

est une tribu. En effet notons B(J) = k J A k, on trouve que B(J) c = B(J c ), c est à dire la stabilité par prise du complémentaire. Par ailleurs la stabilité par union dénombrable (en fait finie) est immédiate, et implique que X M. Définition 2.1.3 Si X est une ensemble et M est une tribu sur X, le couple (X, M) s appelle espace mesurable. Les éléments de M sont appelés parties mesurables de X. La notion de tribu engendrée permet de définir des tribus sans les décrire explicitement. On commence par remarquer que si (M) i I est une famille de tribu, alors M = i I M i est aussi une tribu : Si (A n ) est une famille dénombrable de parties de M, alors pour tout i I, (A n ) M i, donc par union dénombrable on obtient n N A n M i. Donc n N A n M. Le passage au complémentaire s écrit de la même manière, et X appartient à chaque M i donc à M. Un ensemble C de parties de X étant donné on applique maintenant cette propriété à l ensemble des tribus contenant C, en remarquant qu il en existe au moins une : la tribu grossière P(X). Cela conduit à la définition suivante : Définition 2.1.4 Soit X un ensemble et C P(X). On appelle tribu engendrée par C et on note σ(c) la plus petite tribu contenant C : σ(c) = M. M tribu contenant C En général, étant donnés un ensemble de parties C et une tribu M, pour montrer que M = σ(c), il suffit de montrer que toute tribu contenant C contient également M. On remarquera également que M étant une tribu quelconque contenant C, on a σ(c) M, puisque σ(c) est la plus petite. On retourne maintenant à quelques exemples de tribus engendrées. Il est ainsi immédiat de montrer que la tribu associée à une partition est en fait la tribu engendrée par cette partition (exemple 2.1.2). On prendra cependant garde au fait qu en général, la tribu engendrée par un ensemble de parties C ne coincide pas avec l ensemble des unions de parties de C, ni avec l ensemble de ses intersections. Un des exemples fondamentaux de tribus provient de la construction précédente appliquée à une topologie (i.e. l ensemble des ouverts d un espace topologique). Définition 2.1.5 Soit X un espace topologique. On appelle tribu borélienne B(X) la tribu engendrée par les ouverts de X. Ses éléments sont appelés boréliens. Il n est peut-être pas inutile de rappeler ce qu est un ouvert : Une famille de parties O de X est une topologie, dont les éléments sont appelés ouverts si (a) U 1, U 2 O = U 1 U 2 O, (b) (U i ) i I O = i I U i O, (c), X O. (2.1) 9

On remarquera en particulier que l union se fait sur un ensemble infini quelconque, pas forcément dénombrable. Revenons maintenant aux boréliens. D après la définition, un borélien peut avoir une structure compliquée. Par exemple une réunion dénombrable de fermés est un borélien. Ainsi Q, est un borélien de R puisque réunion dénombrable de singletons. R/Q est également un borélien par prise du complémentaire de Q. La tribu des boréliens de R d, pour d 1, satisfait la propriété suivante. Proposition 2.1.6 On a i) La tribu B(R) est engendrée par l une quelconque des familles d intervalles : {], a[; a R}, {], a]; a R}, {]a, + [; a R}, {[a, + [; a R} {[a, b]; a, b R}, {]a, b[; a, b R}, {]a, b]; a, b R}, {[a, b[; a, b R}. ii) La tribu B(R d ) est engendrée par les pavés compacts (produits d intervalles fermés). Preuve. On va d abord prouver la troisième assertion. Soit C l ensemble des pavés compacts. On a C B(R d ) donc aussi σ(c) B(R). Pour obtenir l inclusion réciproque, on considère σ(c) la tribu engendrée par les pavés compact. Alors d après le Lemme 1.3.1, tout ouvert U est réunion dénombrable de pavés compacts (que l on peut prendre d extrémités rationelles) donc U σ(c) puisque σ(c) est une tribu. La topologie O toute entière (l ensemble des ouvert) est donc inclue dans σ(c) et on obtient O σ(c) = σ(o) σ(c). Puisque σ(c) est par définition l ensemble des boréliens, on a prouve l inclusion réciproque B(R d ) σ(c) et l égalité en découle. Pour la deuxième assertion, le cas des intervalles fermés du type [a, b] est un cas particulier pour d = 1 de ce qui vient d être prouvé. Par ailleurs pour tout a b R, on a [a, b] = n N ]a 1/n, b + 1/n[ On obtient que les pavés fermés sont dans la tribu des pavés ouverts, et que donc la tribu B(R d ) est aussi engendrée par les pavés ouverts, et par la même procédure par les pavés mixtes. De même on remarque que [a, b] = [a, + [ ], b] = [a, + [ ]b, + [ c = [a, + [ ( n N [b + 1/n, + [) c, donc la tribu B(R d ) est aussi engendrée par les intervalles du type [a, [. Les autres cas se traitent de manière identique. Remarque 2.1.7 La même preuve donne également que la tribu B(R) est engendrée par l une quelconque des familles d intervalles suivante : {[, a[; a R}, {[, a]; a R}, {]a, + ]; a R}, {]a, + [; a R}. 10

On introduit également les tribus associées à une fonction : Proposition 2.1.8 (Tribu image réciproque) Soit X un ensemble, (Y, N ) un espace mesurable et f : X Y une application. Alors l ensemble f 1 (N ) def = { f 1 (B); B N } est une tribu, appelée tribu image réciproque de N par f. (On l appelle également tribu engendrée par f, et elle est parfois notée σ(f).) Preuve. La preuve est une conséquence directe des propriétés sur les images réciproques sur les fonctions rappelées en fin de Section 2.2 : Si B N, alors ( f 1 (B) ) c = f 1 (B c ) f 1 (N ), de plus f 1 (Y ) = X f 1 (N ), et enfin pour (B n ) une suite de parties mesurables de Y on a n N f 1 (B n ) = f 1 ( n N B n ) f 1 (N ), ce qui implique le résultat. Pour finir cette partie sur les tribus on introduit Définition 2.1.9 (Tribu produit) Soit (X i, M i ) 1 i n une famille finie d espace mesurables. On appelle tribu produit des M i et on note 1 i n M i la tribu engendrée par la famille des produits 1 i n A i lorsque A i M i. On appelle alors espace produit l ensemble 1 i n X i muni de la tribu 1 i n M i. On le notera parfois 1 i n (X i, M i ). Exemple 2.1.10 On pourra par exemple vérifier en exercice que 2.2 Applications mesurables B(R) B(R) = B(R 2 ). Définition 2.2.1 Soient (X, M) et (Y, N ) deux espaces mesurables. Une application f : X Y est dite mesurable si pour tout B N, f 1 (B) M. (Ceci s écrit aussi f 1 (N ) M). On remarquera que si M = P(X) ensemble des parties de X, alors toute fonction est mesurable. C est de toute façon la plus grosse tribu possible sur X. Réciproquement on peut se demander quelle est la plus petite tribu sur X rendant f mesurable. c est évidement f 1 (N ), la tribu engendrée par f. Exemple 2.2.2 On pourra verifier que si A est un ensemble mesurable, alors la fonction caractéristique 1 A est mesurable (l espace d arrivée est ici R muni de la tribu borélienne). 11

En effet, pour B B(R), l ensemble 1 1 A (B) est soit le vide soit A, et dans tout les cas dans M. Remarque 2.2.3 Lorsque les espaces X et Y sont des espaces topologiques, ils sont munis naturellement de leur tribu borélienne. Les fonctions mesurables de X dans Y sont alors dites boréliennes. Le cas des fonctions à valeur réelles sera en particulier très important. Les fonctions mesurables se composent bien : Proposition 2.2.4 Soient (X, M), (Y, N ) et (Z, ) trois espaces mesurables et X f Y g Z des applications mesurables. Alors g f est mesurable. Preuve. Soit C T. Alors (g f) 1 (C) = f 1 (g 1 (C)) M. La définition de mesurabilité n est a priori pas très maniable. Dans la pratique pour montrer qu une application est mesurable, on utilise souvent le critère suivant Proposition 2.2.5 Soient (X, M) et (Y, N ) deux espaces mesurables. On suppose que N = σ(c) pour un ensemble C donné. Pour que f soit mesurable il ( faut et il) suffit que f 1 (C) M. Preuve. Pour montrer que f est mesurable, il faut montrer que pour tout B N, on f 1 (B) M. Considérons donc cet ensemble T = { B N ; f 1 (B) M } N et montrons qu il vaut N tout entier. Pour ça il suffit de montrer que c est une tribu qui contient C ce qui donnera N = σ(c) σ(t ) = T, d où le résultat. Il est clair que cet ensemble contient C puisque f 1 (C) M. Montrons que c est une tribu : Pour B T, on a f 1 (B c ) = (f 1 (B)) c M puisque M est une tribu. De plus, f 1 (Y ) = X M. Enfin si (B n ) est une suite d éléments de T, on a f 1 ( n N B n ) = n N (f 1 (B n )) M. Donc T est une tribu. La première application de cette proposition est fondamentale, ne serait-ce que pour la légitimité de la théorie de la mesure que nous sommes en train de construire. Proposition 2.2.6 Soient (X 1, O 1 ) et (X 2, O 2 ) deux espaces topologiques munis de leurs tribus boréliennes respectives. Alors toute fonction continue de X 1 dans X 2 est mesurable. Preuve. La continuité d une fonction signifie que f 1 (O 2 ) O 1 (suivant les conventions d écritures habituelles). Notons B 1 et B 2 les tribus boréliennes associées à X 1 et X 2. On obtient donc que a fortiori que f 1 (O 2 ) B 1. Or σ(o 2 ) = B 2 donc la Proposition 2.2.5 implique le résultat. La deuxième application est un critère relativement simple pour montrer la mesurabilité d une fonction à valeur dans R ou R. 12

Sauf mention explicite du contraire on supposera lorsque l espace d arrivée est R ( resp. R) qu il est toujours muni de sa tribu des boréliens. Une application sera alors simplement dite mesurable sans référence aux tribus. Proposition 2.2.7 Soit (X, M) un espace mesurable et f : X R (resp R) une application. Les énoncés suivants sont équivalent : i) f est mesurable, ii) b R, {f < b} X, iii) b R, {f b} X, iv) b R, {f > b} X, v) b R, {f b} X, (2.2) Preuve. La preuve est immédiate : il suffit de considérer les ensembles générateurs de la tribu des boréliens vus dans le i) de la Proposition 2.1.6 et d utiliser la Proposition 2.2.5. On fera attention au fait que lorsque l espace d arrivée est R, on a {f < b} = f 1 (], b[) alors que si l espace d arrivée est R, c est f 1 ([, b[). Exemple 2.2.8 Considérons une fonction monotone f : X R, où X est une partie mesurable de R, que l on muni de la tribu B(R) X (voir exercices). Pour fixer les idées supposons f par exemple croissante. Pour b R, posons A = f 1 (], b]) On vérifie que si a A, alors pour tout x a, on a f(x) f(a) b donc x A. On vient de montrer que A est un intervalle (de X) du type ], sup A[ X ou ], sup A] X. C est donc un élément de B(R) X. Par suite f est mesurable. En troisième application de la Proposition 2.2.5, on étend le Lemme de composition des fonctions et on étudie la stabilité de l espace des fonctions mesurables vis a vis des opérations usuelles. Proposition 2.2.9 Soient (X, M) et (Y, N ) deux espaces mesurables et R d muni de la tribu des Boréliens (resp R d +). Soient alors u 1,..., u d des applications mesurables de X dans R (resp R + ) et Φ une application mesurable de R d (resp R d +) dans Y. Alors l application X x Y Φ(u 1 (x),..., u d (x)) est mesurable. En particulier si f, g : X R (resp R + ) sont mesurables, alors alors f + g, fg, sup(f, g), inf(f, g) le sont aussi. (on fait la convention 0 = 0) De plus, f : X C est mesurable si et seulement si Re (f) et Im (f) le sont et dans ce cas f l est aussi. Si f, g : X C sont mesurables, alors f + g et fg le sont aussi. Preuve. Pour montrer la première partie de la proposition, il suffit de montrer la mesurabilité de l application u : x (u 1 (x),...u d (x)) de X dans R. Vérifions que l image réciproque d un pavé compact est dans M. On a : u 1 [a j, b j ] = u 1 j ([a j, b j ]). 1 j d 13 1 j d

Or les u j sont mesurables, donc cet ensemble est dans M. Pour la deuxième partie, la preuve est immédiate : par exemple l addition est continue donc mesurable de R 2 dans R, ce qui donne la mesurabilité de f + g. Pour la multiplication, on a le même résultat. Pour le cas de la droite achevée positive, et avec la convention 0 = 0, l addition est continue donc mesurable et la multiplication est mesurable (attention elle n est pas continue sur R 2 ), ce qui donne le résultat. On fait de même pour les applications à valeur dans C. 2.3 Structure des fonctions mesurables Proposition 2.3.1 Soit (X, M) un espace mesurable et (f n ) n N une suite de fonctions mesurables de X dans R. Alors les fonctions sup f n, inf f n, lim sup f n et lim inf f n sont mesurables. En particulier la limite simple d une suite de fonctions mesurables est mesurable. Preuve. Posons g = sup f n. On utilise de nouveau la Proposition fondamentale 2.2.5 : Soit b R, on a g 1 (]b, + ]) = n N fn 1 (]b, + ]) M par union dénombrable dans M. En effet pour x dans g 1 (]b, + ]), on a sup f n (x) = g(x) > b n 0 N, tel que f n0 (x) > b. n N D après la remarque 2.1.7, la tribu des boréliens B(R) est engendrée par la famille des intervalles du type ]b, + ], donc sup f n est mesurable. Par ailleurs les identités inf f n = sup( f n ), lim sup f n = inf (sup f k ), n k n lim inf f n = sup( inf f k) n k n assurent la mesurabilité des fonctions correspondantes. Si pour tout x X, f n (x) converge, alors d après la proposition 1.1.3, lim f n (x) = lim sup f n (x) donc la limite simple de f n est mesurable. On a déjà vu qu une fonction caractéristique était mesurable. La famille suivante est importante Définition 2.3.2 Soit (X, M) un espace mesurable. Une fonction s est dite étagée sur X si s : X R + est mesurable et ne prend qu un nombre fini de valeurs. Si on note α 1,..., α m les valeurs distinctes prises par s et si on note pour chaque k A k = s 1 ({α k }) = {x X; s(x) = α k }, alors l ensemble des A k forme une partition de X et on appelle écriture canonique l écriture unique suivante s = 1 k m α k 1 Ak. Une fonction étagée s est donc une combinaison linéaire finie de fonctions indicatrices mesurables. Il est facile de vérifier que l ensemble des fonctions étagées forme une algèbre. La Proposition suivante sera très utile pour construire l intégrale d une fonction dans le prochain chapitre : Théoreme 2.3.3 Soit (X, M) un espace mesurable et f : X R + une application mesurable. Il existe une suite de fonctions étagées (s n ) n 1 telle que 14

i) 0 s 1 s 2.. s n s n+1... f, (suite croissante de fonctions) ii) x X, lim n s n (x) = f(x), (convergence simple), ce que l on notera lim s n = f. Si en plus f est bornée, alors la convergence de s n vers f est uniforme, i.e. lim sup s n (x) f(x) 0. n x X Bien sur la réciproque du point ii) est vraie par simple application de la Proposition 2.3.1 : Si f est limite simple d une suite de fonction étagées, alors elle est mesurable. Pour prouver le théorème, on va utiliser la méthode des approximations dyadiques tronquées. Il faut noter que c est la première mise en oeuvre du principe de découpage suivant l espace d arrivée. Preuve. Pour tout n N, on définit la fonction suivante : s n (x) = { k 2 si f(x) [ k n 2, k+1 [ n 2, pour 0 k n2 n 1 (découpage) n n si f(x) n (troncature) ce qui correspond à un découpage à l arrivée de l intervalle [0,n] en n2 n intervalles de même longueur. Pour tout n 1, la fonction s n est étagée, et on a précisément k s n = 2 n 1 { k 2 n f< k+1 2 n } + n1 {f n} 0 k n2 n 1 ce qui implique qu elle est mesurable puisque f l est. Montrons d abord que s n est une suite croissante de fonctions (à ne pas confondre avec une suite de fonctions croissantes...). Soit x X et n N. Si f(x) n = n2n+1 alors 2 n+1 s n+1 (x) vaut soit n + 1 n soit k2n+1 pour un k n, ce qui implique dans les deux cas 2 n+1 s n+1 (x) s n (x). Si maintenant f(x) < n, alors il existe un entier k unique tel que ce qui implique k 2 n f(x) < k 2 n < n, 2k 2k + 1 f(x) < 2n+1 2 n+1 < n ou 2k + 1 2 n+1 f(x) < 2k + 2 2 n+1 < n. Dans le premier cas, s n+1 = 2k = k 2 n+1 2 = s n n (x), et dans le deuxième s n+1 = 2k+1 s n (x). Dans tout les cas on a montré que s n+1 (x) s n (x). > k 2 n+1 2 = n Etablissons ensuite la convergence simple de s n vers f : Soit x fixé, alors si f(x) = +, on a s n (x) = n = f(x) lorsque n tend vers l infini, si f(x) est fini, alors pour n > f(x) on a f(x) 1/2 n s n (x) < f(x), (2.3) donc s n (x) tend vers f(x) par le théorème des gendarmes. Supposons maintenant que f est bornée de borne M. Alors pour tout n M, l inégalité 2.3 est satisfaite pour tout les x, ce qui implique que cela conclue la preuve du Théorème. sup s n (x) f(x) 1 x X 2 n n 0 15

Chapitre 3 Mesures et intégration Dans le Chapitre précédent nous avons répertorié les ensembles susceptibles d être mesuré, ainsi que les fonctions mesurables. Il est temps maintenant de leur associer effectivement une quantité à l aide des mesures. 3.1 Mesures Définition 3.1.1 Soit (X, M) un espace mesurable. Une mesure positive sur X est une application µ : M R + telle que (a) µ( ) = 0, (b) si (A n ) n N est une suite d éléments de M deux a deux disjoints, alors µ( n N A n ) = n N µ(a n ) (additivité dénombrable). Le triplet (X, M, µ), où simplement X s il n y a pas d ambiguté sur la tribu et la mesure est alors appelé espace mesurable. De plus lorsque X est de mesure finie égale à 1, on dit que µ est une mesure de probabilité. On peut donner quelques exemples simples de telles mesures : Exemples 3.1.2 1. Si X est une ensemble fini, muni de la tribu P(X), on peut considérer la mesure µ 0 définie par µ 0 (A) = Card(A). 2. Si X est une ensemble fini non vide, muni de la tribu P(X), on peut considérer la mesure µ 1 définie par µ 1 (A) = Card(A)/Card(X). On vérifiera alors que µ 1 est une mesure de probabilité. 3. Une extension de la première mesure est la mesure de comptage : Si X est une ensemble quelconque, muni de la tribu P(X), on peut considérer la mesure µ définie par { Card(A) si A est fini, µ 2 (A) = si A est infini. 16

4. Si X est une ensemble non vide, muni de la tribu P(X), et si a est un élément de X fixé, on peut considérer la mesure de Dirac δ a, définie par { 1 si a A, δ a (A) = 0 si a A. On pourra remarquer que formellement au moins, on a la relation µ 2 = a X δ a. 5. L un des but du cours est de construire une mesure sur la tribu B(R) des boréliens de R, qui sera appelée mesure de Borel, avec au moins la propriété naturelle suivante : Pour a b, la mesure de l intervalle [a, b] est donnée par µ([a, b]) = b a. Il est facile d étendre µ à une réunion finie d intervalle, par contre l extension à l ensemble des boréliens de R est difficile et sera abordée au Chapitre 5. 6. On se donne une fonction ν continue et positive sur R. On cherche alors à définir la mesure de densité µ ν sur la tribu des boréliens qui, sur les intervalles, vaut µ ν (]a, b[) = b a ν(t)dt. L intégrale étant celle de Riemann. Il s agit en fait de l extension de l exemple précédent dans lequel on avait ν = 1. De nouveau il est simple de définir µ ν sur les réunions d intervalles, et le prolongement à tout B(R) sera vu plus tard. 7. Nous construirons également la mesure de Borel sur R d. Il s agit d une mesure définie sur les Boréliens et qui sur les pavés 1 j d [a j, b j ] vaut µ [a j, b j ] = (b j a j ) 1 j d 1 j d lorsque a j b j (0 sinon). C est la version d-dimensionnelle de l exemple 5. 8. Probabilité de Cauchy sur R de paramètre α > 0. Il s agit de la mesure positive de densité ν(t) = 1 α π α 2 + t 2. C est une mesure de Probabilité puisque + [ ] 1 + µ(r) = ν(t) = π arctan(t/α) = 1. On peut rappeler la définition de la fonction de répartition d une mesure de probabilité sur (un sous-ensemble de ) R : F ν (t) = µ(], t]) C est une fonction définie sur R, continue à droite, croissante de limite 0 en et 1 en +. 9. Probabilité de Gauss de moyenne m et écart-type σ. C est la mesure positive de densité ν(x) = 1 σ m)2 exp (x 2π 2σ 2. 17

10. Probabilité de Bernouilli de paramètre p [0, 1]. C est une mesure de probabilité sur l ensemble {0, 1} définie par µ = pδ 0 + (1 p)δ 1. 11. Probabilité binomiale de paramètres n N et p [0, 1]. C est une mesure de probabilité sur l ensemble fini {0, 1,..., n} muni de la tribu de ses parties, et définie par µ = Cnp k k (1 p) n k δ k. 0 k n On pourra vérifier que pour A P(N n ), µ(a) = k A C k np k (1 p) n k. 12. Probabilité de Poisson de paramètre λ > 0. C est la mesure de Probabilité sur N muni de la tribu de ses parties, et définie par µ = e λ k N λ k k! δ k. Après la revue de ces exemples, passons aux propriétés des mesures positives. Proposition 3.1.3 Soit (X, M, µ) un espace mesuré, où µ est une mesure positive. Les propriétés suivantes sont satisfaites : i) Additivité forte : A, B M, µ(a B) + µ(a B) = µ(a) + µ(b); ii) Monotonie : iii) σ-sous additivité : A, B M, A B = µ(a) µ(b); (A n ) n N M, µ( n N A n ) n N µ(a n ); iv) Continuité croissante : Pour toute suite croissante (A n ) n N d ensembles mesurables on a µ( n N A n ) = lim µ(a n) = sup µ(a n ); n v) Continuité décroissante : Pour toute suite décroissante (A n ) n N d ensembles mesurables, telle que µ(a 0 ) <, on a n 0 µ( n N A n ) = lim n µ(a n) = inf n 0 µ(a n). Preuve. i) On a A B = (A B c ) disj B, donc µ(a B) = µ(a B c ) + µ(b) d où µ(a B) + µ(a B) = µ(a B c ) + µ(a B) +µ(b) } {{ } µ(a) d ou le résultat. 18

ii) Provient directement du fait que A disj (A B c ) = B. iii) On définit une suite (B n ) d ensembles de la manière suivante : B 0 = A 0, et n 1, B n = A n \ k n 1 A k. Les ensembles B n sont dans M, deux à deux disjoints et on a n N A n = n N B n. On en déduit µ( n N A n ) = µ( n N B n ) = µ(b n ) µ(a n ) n N n N puisque pour chaque n N, B n A n. iv) On définit une suite (B n ) d ensembles de la manière que pour iii) ce qui donne ici puisque la suite est croissante B 0 = A 0, et n 1, B n = A n \ k n 1 A k. Les ensembles B n sont dans M, deux à deux disjoints et on a de plus pour tout n N, A n = k n A k = k n B k ainsi que n N A n = n N B n. On peut alors écrire µ( n N A n ) = µ( n N B n ) = µ(b n ) = lim µ(b k ) = lim µ(a n) = sup µ(a n ). n n n N k n v) On va se ramener au cas du iv). On pose A = A n On a A 0 \( A n ) = A 0 ( A c n) = n N (A 0 A c } {{ n) }. suite croissante D après iv) appliqué à la suite (A 0 A c n), on obtient que lim µ(a 0 A c n n) = µ(a 0 A c ) = µ(a 0 \A) Par ailleurs A 0 est de mesure finie (c est ici qu on utilise l hypothèse), donc pour chaque k on > µ(a 0 ) = µ(a n ) + µ(a 0 A c n), ainsi que > µ(a 0 ) = µ(a) + µ(a 0 A c ). En particulier µ(a n ), µ(a 0 A c n) et µ(a 0 ) sont des réels ce qui donne n N µ(a n ) = µ(a 0 ) µ(a 0 A c n) Cela termine la preuve. en décroissant µ(a 0 ) µ(a 0 A c ) = µ(a). Remarque 3.1.4 1. Si la mesure est finie on peut appliquer la continuité décroissante sans restriction, puisque pour tout A 0 premier terme d une suite, µ(a 0 ) est fini. 2. Réciproquement on peut étudier la suite d ensembles suivante : soit pour tout n N, A n = {n, n + 1, n + 2,...} N muni de la tribu de ses parties et de la mesure de comptage. C est une suite décroissante et on a = lim µ(a n ) µ( A n ) = µ( ) = 0 La condition portant sur A 0 n est pas satisfaite pour cette suite. On pourra vérifier qu une condition nécessaire et suffisante est en fait qu il existe n 0 tel que µ(a n0 ) <. 19

3.2 Intégration des fonctions positives Le but de cette section est de définir l intégrale par rapport à µ des fonctions mesurables positives. Dans un premier temps on va définir l intégrale des fonctions étagées, qui ont été définies en 2.3.2. On pourra se rappeler que les ensembles mesurables intervenant dans la définition peuvent être assez compliques, et la tribu M très grosse (elle contient par exemple les réunions dénombrables d intersections dénombrables d ouverts...) Lemme 3.2.1 Soit (X, M, µ) un espace mesuré où µ est une mesure positive. Soit s une fonction étagée d écriture canonique s = 1 k m α j 1 Ak (voir la définition 2.3.2). On pose alors I(s) def = α k µ(a k ), (3.1) (avec la convention 0 = 0). On a alors pour s, t étagées et λ 0, ainsi que I(s) = sup I(σ), (3.2) σ étagée,σ s I(s + t) = I(s) + I(t), I(λs) = λi(s), et s t I(s) I(t) (3.3) Preuve. Montrons d abord la première assertion. Considérons deux fonctions étagées σ et s telles que σ s. On sait que l on peut écrire σ = k m β k 1 Bk et s = j n α j 1 Aj où (A j ) et (B k ) forment une deux partitions de X. En particulier on peut écrire que pour chaque k m on a µ(a k ) = j n µ(a k B j ), d où I(σ) = k m β k µ(b k ) = k m, j n β k µ(b k A j ) On constate alors que soit B k A j = qui est de mesure nulle, soit B k A j, auquel cas pour x B k A j on a β k = σ(x) s(x) = α j ce qui donne I(σ) k m, j n α j µ(b k A j ) = j n α j µ(a j ) = I(s) puisque (B k ) est une partition de X. Le dernier point de la proposition est immédiat compte tenu de la définition. Pour la propriété de multiplication par un scalaire, soit λ 0. Si λ = 0 l assertion est triviale, sinon lorsque λ > 0 on écrit que pour s étagée on a I(λs) = I λ α j 1 Aj = I λα j 1 Aj = λα j µ(a j ) = λi(s) j n j n j n 20

d après la définition de I. La preuve de la propriété concernant la somme est à peine plus difficile. On considère s et t deux fonctions étagées. Alors la somme s + t est également étagée (elle ne prend qu un nombre fini de valeurs) et mesurable (comme somme de fonctions mesurables). Précisément on peut écrire s = α j 1 Aj, t = β k 1 Bk, s + t = (α j + β k )1 Aj B k j n k m j n,k m où pour s et t on a choisi l écriture canonique. On obtient ainsi que I(s) + I(t) = j n α j µ(a j ) + k m β k µ(b k ) Mais puisque A k et B j forment deux partitions de X on peut écrire I(s) + I(t) = (α j + β k )µ(b k A j ) k m, j n Pour calculer I(s + t) il faut identifier l écriture canonique de s + t. Indexons par l p l ensemble des valeurs différentes γ l prises par α j + β k lorsque j n et k m. On a alors s + t = l p γ l 1 Cl où on a posé C l = (s + t) 1 ({γ l }). On a alors par définition I(s + t) = l p γ l µ(c l ). Mais par ailleurs C l = où l union est finie et disjointe, donc µ(c l ) = j, k, tels que α j + β k = γ l j, k, tels que α j + β k = γ l A j B k µ(a j B k ) ce qui donne finalement I(s + t) = l p = j n, k m j, k, tels que α j + β k = γ l γ l µ(a j β k ) = l p j, k, tels que α j + β k = γ l (α j + β k )µ(a j β k ) = I(s) + I(t), (α j + β k )µ(a j β k ) d où le résultat. Le Lemme est prouvé. Remarques 3.2.2 21

1. La quantité I(s) a été définie en utilisant l écriture canonique de s, en particulier pour chaque k, on a A k = s 1 (α k ) avec des réels positifs α k tous différents. On peut en fait montrer (le faire) sans difficulté que la formule de définition (3.1) est valable même si l écriture de s n est pas canonique. 2. On notera aussi que fonction nulle est étagée et que I(0) = 0. Une alternative pour éviter d avoir affaire appel à la convention 0 = 0 est de ne considérer que les fonctions étagées non nulles et les α k > 0. La fonction nulle n est alors plus étagée et on pose alors I(0) = 0. 3. On voit dans cette définition le point fondamental de la théorie de Lebesgue qui est de découper l ensemble d arrivée et d y regarder les valeurs prises par la fonction (pour les fonctions étagées suivant les valeurs des α j ) puis de considérer les images réciproques (ici les A j ) par la fonction. C est évidement une procédure différente de celle employée pour construire l intégrale de Riemann, où on découpe d abord l espace de départ en intervalles, sur lesquels on regarde les valeurs prises par la fonction à intégrer. Nous verrons plus loin que l intégrale de Lebesgue, construite par la première procédure solutionne un certain nombres de problèmes laissés ouverts par l intégrale de Riemann. On peut maintenant définir l intégrale des fonctions mesurables de X dans R +. Définition 3.2.3 Soit (X, M, µ) un espace mesuré où µ est une mesure positive. Pour f : X R + mesurable, on pose Remarque 3.2.4 X fdµ = sup I(σ) s étagée, s f 1. On observe évidement tout de suite que si f est étagée, on a fdµ = I(f) X au sens de la définition du lemme 3.2.1. Lorsqu il n y a pas d ambiguité sur l espace d intégration, on pourra noter fdµ au lieu de X fdµ. 2. Pour A M, on définit également l intégrale sur A d une fonction f : X R + mesurable, définie par fdµ = f 1 A dµ. A 3. Dans la définition 3.2.3, le sup peut être pris sur une suite croissante de fonctions mesurables étagées positives. C est un résultat important en pratique que l on donne dans le lemme qui suit. On rappelle également que la limite de telles suites caractérise justement les fonctions mesurables positives par le Théorème 2.3.3. Le résultat qui vient peut également être considéré comme un premier résultat d interversion de limite et d intégrale. Lemme 3.2.5 Soit (X, M, µ) un espace mesuré où µ est une mesure positive. Considérons une suite croissante (s n ) de fonctions étagées positives telles que lim s n = f (limite simple) avec donc f : X R + mesurable. On a alors lim s n dµ = lim s n dµ = fdµ. X 22

Preuve. On commence par mentionner que la suite numérique ( s n dµ) converge bien dans R +, étant croissante d après le Lemme 3.2.1. D après la Définition 3.2.3, l inégalité lim s n dµ fdµ est immédiate. Prouvons-la dans l autre sens. Pour cela il suffit de montrer que si g f est une fonction étagée, alors gdµ lim s n dµ. (3.4) On considère pour cela 0 < ε 1 un réel, et on pose pour tout n N A n = {s n (1 ε)g} def = {x X; s n (x) (1 ε)g(x)}. Comme (s n ) est une suite croissante de fonctions, (A n ) définit une suite croissante d ensembles mesurables de réunion X puisque s n converge simplement vers f g. On a également grace à la définition des A n que pour tout n s n (1 ε)g 1 An ce qui implique par la propriété de croissance du Lemme 3.2.1 que s n dµ (1 ε) g 1 An dµ. Si maintenant g a pour écriture canonique g = 1 k m α k 1 Bk alors g 1 An, qui est également une fonction étagée s écrit 1 k m α k 1 Bk A n et on obtient que g 1 An dµ = µ(a n B k ) µ(b k ) = gdµ lorsque n, k m k m où la convergence vient de la propriété de continuité croissante de la mesure µ, point iv) de la Proposition 3.1.3. On a ainsi obtenu que lim s n dµ (1 ε) gdµ ce qui implique (3.4) puisque ε est arbitrairement petit. Le lemme est donc prouvé. Exemples 3.2.6 Il est utile de reprendre les exemples du paragraphe précédent, et les intégrales correspondantes. 1. On considère X = {x 1,..., x n } un ensemble fini, muni de la tribu P(X) et de la mesure définie par µ 0 (A) = Card(A) pour A X. Toutes les fonctions sont alors étagées et mesurables, et on obtient pour une telle fonction f fdµ 0 = n f(x j )1 {xj }dµ 0 = j=1 n f(x j ). j=1 23

2. Sur le même espace (de cardinal n) muni de la mesure µ 1 définie par µ 1 (A) = Card(A)/n. on obtient fdµ 1 = n f(x j )1 {xj }dµ 0 = j=1 n f(x j )/n. 3. Pour la mesure de comptage µ 2, définie sur X = {x i, i I} quelconque muni de la tribu P(X), on obtient de même fdµ 2 = f(x i ) def = sup f(x i ) i I J fini I i J 4. Si X est une ensemble non vide, muni de la tribu P(X), et si a est un élément de X fixé, on a lorsque µ est la mesure de Dirac δ a, fdµ = f(a) j=1 5. Pour la mesure de Borel m sur R d, que nous verrons au Chapitre 5, on notera l intégrale par le même signe que l intégrale de Riemann R d f(x)dx. On verra que cette intégrale coincide avec l intégrale de Riemann pour les fonctions continues à support compact. Elle permettra cependant aussi d intégrer des fonctions beaucoup plus compliquées, par exemple R d 1 Q (x)dx = m(q) = 0. 6. 7. Losque µ est une mesure de densité ν par rapport à la mesure de Borel, on a fdµ = f(x)ν(x)dx R d R d ce qui justifie la notation infinitésimale dµ = νdx. 8. 9. Les mesures de probabilité de Cauchy (sur R) et de Laplace-Gauss (sur R d ) entrent dans la catégorie précédente avec respectivement les densités ν(t)dt et ν(x)dx où ν est défini respectivement par ν(t) = 1 π α α 2 + t 2 et ν(x) = 1 σ m)2 exp (x 2π 2σ 2. 10. 11. 12. Les probabilités de Bernouilli, binomiale et de Poisson sont construites à partir de mesures de Dirac sur des entiers et on obtient sans peine que pf(0) + (1 p)f(1) Bernouilli, paramètre p fdµ = 0 k n Ck np k (1 p) n k f(k) binomiale, paramètres (n, p), e λ k N λk k! f(k) Poisson, paramètre λ. 24

On passe maintenant en revue quelques propriétés fondamentales de l intégrale d une fonction positive. Compte tenu de leur importance, les Théorèmes de convergence seront vus dans un chapitre dédié. Proposition 3.2.7 Soit (X, M, µ) un espace mesuré où µ est une mesure positive. On a alors pour f et g : X R + des fonctions mesurables et λ 0, λfdµ = λ fdµ, (f + g)dµ = fdµ + gdµ et f g fdµ gdµ. (On rappelle que l on utilise toujours la convention 0 = 0). Preuve. Compte tenu du travail précédent la preuve est assez courte. On considère deux suites de fonctions étagées (s n ) et (t n ) convergeant en croissant vers respectivement f et g. C est possible grace au Lemme 2.3.3. On a alors lim (s n + t n ) = f + g, et lim λs n = λf. On obtient ainsi grace au Lemmes 3.2.5 et 3.2.1 que λfdµ = lim λs n = lim λ s n dµ = λ fdµ. De la même manière on peut écrire que (f + g)dµ = lim (s n + t n ) = lim ( s n dµ + t n dµ) = fdµ + gdµ. Le dernier point est une conséquence directe du premier. Cela conclue la preuve de la Proposition. 25

Chapitre 4 Théorèmes de convergence et fonctions intégrables Dans le Chapitre précédent, on a pu définir l intégrale d une fonction mesurable à valeur dans R +. Nous allons principalement dans ce chapitre établir des Théorèmes d interversion d intégrale et de limite sous des hypothèses faible de convergence. C est un des atouts majeurs de l intégrale de Lebesgue. 4.1 Théorèmes de convergence Le premier théorème que nous présentons concerne les suites croissantes de fonctions et est à mettre en parallèle avec le Lemme 3.2.5. Théoreme 4.1.1 Théorème de convergence monotone dit de Beppo-Levi. Soit (X, M, µ) un espace mesuré où µ est une mesure positive. Considérons une suite croissante def (f n ) de fonctions mesurables de X dans R + telles que lim f n = f (limite simple), avec donc f : X R + mesurable. On a alors lim f n dµ = lim f n dµ = fdµ. Preuve. Un examen attentif de l énoncé aura permit de se rendre compte qu il est identique a celui du Lemme 3.2.5 sauf que l on a remplacé la suite (s n ) par ici la suite (f n ). Pour la preuve de ce théorème il en est exactement de même, quitte à faire appel à la Proposition 3.2.7 au lieu du Lemme 3.2.1 quand il y est fait référence. On pourra remarquer que l hypothèse de convergence est réduite a la convergence simple. Evidement sans l hypothèse de croissance le résultat est faux (voir plus loin le contre exemple donné en 4.1.6). On donne maintenant un corollaire concernant la convergence des séries de fonctions positives. Corollaire 4.1.2 Soit (X, M, µ) un espace mesuré où µ est une mesure positive. Considérons une suite (f n ) de fonctions mesurables de X dans R +. On pose pour tout x X, S(x) = 26

n 0 f n(x). Alors S est mesurable positive et on a f n dµ = f n dµ = n N n N Sdµ. Preuve. La mesurablité de S est une conséquence de la Proposition 2.3.1, puisque S est limite simple de la suite des fonctions sommes partielles définies pour tout n N par S n (x) = f k (x). k n Bien sur chaque S n est mesurable comme somme finie de fonctions mesurables en vertu de la Proposition 2.2.9. Comme lim S n = S, on peut appliquer le Théorème de Beppo-Levi 4.1.1 qui donne Sdµ B.L. = lim n S n dµ = lim n f k dµ k n Prop. 3.2.7 = lim n k n f k dµ = k 0 f k dµ. Les égalités ci dessus on lieu dans R + et la Proposition 3.2.7 est utilisée pour écrire que l intégrale d une somme finie est la somme des intégrales. Le résultat est prouvé. Une deuxième application du Théorème de Beppo-Levi concerne les mesures à densité. Corollaire 4.1.3 Soit (X, M, µ) un espace mesuré où µ est une mesure positive. Considérons une fonction ν mesurable de X dans R +. Pour tout A M, on définit λ(a) = A νdµ. Alors λ est une mesure positive définie sur M, et si f est une fonction mesurable positive, on a fdλ = fνdµ. On notera dλ = νdµ et on dira que dλ est la mesure de densité ν par rapport à la mesure dµ. Remarque 4.1.4 1. On prendra garde au fait que le produit des deux fonctions mesurables fν ci dessus est bien défini dans R + avec la convention 0. = 0. 2. Cette construction répond aux exemples 6 et 7 de la série d exemples 3.1.2 et 3.2.6 : une mesure étant construite (ici µ), il est direct de construire toute une famille de mesures, dites à densité par rapport à la première. Dans le cas réel, deux mesures étant données, les rapports entre l une et l autre (par exemple l une est-elle a densité par rapport à l autre?) font l objet d un théorème difficile, le Théorème de Radon Nikodym, vu en Master. Preuve du Corollaire. Montrons que λ est une mesure. D après la Proposition 3.2.7, on a trivialement λ( ) = νdµ = 0. Considérons maintenant une suite d éléments deux à deux disjoints (A n ) n N de M. On a alors d après le Corollaire 4.1.2 Cor 4.1.2 λ( n N A n ) = νdµ = ν.1 An dµ = ν 1 An dµ = λ(a n ). n N A n X n N n N 27 n N X