Théorie de la Mesure et Intégration



Documents pareils
Intégrale de Lebesgue

Intégration et probabilités TD1 Espaces mesurés Corrigé

Intégration et probabilités TD1 Espaces mesurés

Théorie de la Mesure et Intégration

La mesure de Lebesgue sur la droite réelle

Théorie de la mesure. S. Nicolay

Mesures et Intégration

Intégration sur des espaces produits

THÉORIE DE LA MESURE ET DE L INTÉGRATION.

3. Conditionnement P (B)

Image d un intervalle par une fonction continue

Espérance conditionnelle

Mesure et Intégration (Notes de cours de L3)

Probabilités sur un univers fini

Programmes des classes préparatoires aux Grandes Ecoles

4. Martingales à temps discret

Limites finies en un point

Développement décimal d un réel

Moments des variables aléatoires réelles

Continuité en un point

Calcul fonctionnel holomorphe dans les algèbres de Banach

Dualité dans les espaces de Lebesgue et mesures de Radon finies

I. Polynômes de Tchebychev

Chapitre 2 Le problème de l unicité des solutions

MA6.06 : Mesure et Probabilités

Fonctions de plusieurs variables, intégrales multiples, et intégrales dépendant d un paramètre

MESURE ET INTÉGRATION EN UNE DIMENSION. Notes de cours

Exercices - Fonctions de plusieurs variables : corrigé. Pour commencer

Théorème du point fixe - Théorème de l inversion locale

De même, le périmètre P d un cercle de rayon 1 vaut P = 2π (par définition de π). Mais, on peut démontrer (difficilement!) que

Exercice autour de densité, fonction de répatition, espérance et variance de variables quelconques.

Mesures gaussiennes et espaces de Fock

Construction de l'intégrale de Lebesgue

Calculs de probabilités

n N = u N u N+1 1 u pour u 1. f ( uv 1) v N+1 v N v t

Probabilités sur un univers fini

Simulation de variables aléatoires

Le produit semi-direct

3 Approximation de solutions d équations

Produits d espaces mesurés

Suites numériques 3. 1 Convergence et limite d une suite

* très facile ** facile *** difficulté moyenne **** difficile ***** très difficile I : Incontournable T : pour travailler et mémoriser le cours

Exercices - Polynômes : corrigé. Opérations sur les polynômes

Le théorème de Perron-Frobenius, les chaines de Markov et un célèbre moteur de recherche

PROBABILITÉS: COURS DE LICENCE DE MATHÉMATIQUES APPLIQUÉES LM 390

CCP PSI Mathématiques 1 : un corrigé

Fonctions de plusieurs variables

Calcul différentiel sur R n Première partie

Probabilités. I Petits rappels sur le vocabulaire des ensembles 2 I.1 Définitions... 2 I.2 Propriétés... 2

Chapitre 7 : Intégration sur un intervalle quelconque

Continuité d une fonction de plusieurs variables

Texte Agrégation limitée par diffusion interne

Le modèle de Black et Scholes

Université Paris-Dauphine DUMI2E 1ère année, Applications

I. Introduction. 1. Objectifs. 2. Les options. a. Présentation du problème.

Logique. Plan du chapitre

Cours d Analyse. Fonctions de plusieurs variables

La Licence Mathématiques et Economie-MASS Université de Sciences Sociales de Toulouse 1

Introduction à l étude des Corps Finis

Qu est-ce qu une probabilité?

Chapitre 7. Statistique des échantillons gaussiens. 7.1 Projection de vecteurs gaussiens

Capes Première épreuve

Calcul différentiel. Chapitre Différentiabilité

Travaux dirigés d introduction aux Probabilités

Méthodes de quadrature. Polytech Paris-UPMC. - p. 1/48

Cours de mathématiques

Introduction au Calcul des Probabilités

4 Distributions particulières de probabilités

M2 IAD UE MODE Notes de cours (3)

Séminaire TEST. 1 Présentation du sujet. October 18th, 2013

Chapitre 2. Eléments pour comprendre un énoncé

Filtrage stochastique non linéaire par la théorie de représentation des martingales

FONCTIONS DE PLUSIEURS VARIABLES (Outils Mathématiques 4)

Chapitre 3. Mesures stationnaires. et théorèmes de convergence

Optimisation non linéaire Irène Charon, Olivier Hudry École nationale supérieure des télécommunications

La fonction exponentielle

Economie de l incertain et de l information Partie 1 : Décision en incertain probabilisé Chapitre 1 : Introduction à l incertitude et théorie de

Continuité et dérivabilité d une fonction

Amphi 3: Espaces complets - Applications linéaires continues

Résolution d équations non linéaires

Chp. 4. Minimisation d une fonction d une variable

Les indices à surplus constant

Cours3. Applications continues et homéomorphismes. 1 Rappel sur les images réciproques

Raisonnement par récurrence Suites numériques

Probabilités. C. Charignon. I Cours 3

Baccalauréat S Antilles-Guyane 11 septembre 2014 Corrigé

Souad EL Bernoussi. Groupe d Analyse Numérique et Optimisation Rabat http ://

Probabilité. Table des matières. 1 Loi de probabilité Conditions préalables Définitions Loi équirépartie...

Approximations variationelles des EDP Notes du Cours de M2

Correction du baccalauréat ES/L Métropole 20 juin 2014

Différentiabilité ; Fonctions de plusieurs variables réelles

Calcul matriciel. Définition 1 Une matrice de format (m,n) est un tableau rectangulaire de mn éléments, rangés en m lignes et n colonnes.


Un K-espace vectoriel est un ensemble non vide E muni : d une loi de composition interne, c est-à-dire d une application de E E dans E : E E E

Formes quadratiques. 1 Formes quadratiques et formes polaires associées. Imen BHOURI. 1.1 Définitions

CHAPITRE 5. Stratégies Mixtes

Structures algébriques

1 Définition et premières propriétés des congruences

CHAPITRE IV. L axiome du choix

Programmation linéaire et Optimisation. Didier Smets

Transcription:

Ecole Nationale de la Statistique et de l Administration Economique Théorie de la Mesure et Intégration Xavier MARY

2

Table des matières I Théorie de la mesure 11 1 Algèbres et tribus de parties d un ensemble 13 1.1 Définitions............................. 13 1.2 Tribu engendrée, tribu image réciproque............ 14 1.3 Exemples............................. 15 1.4 Produit d espaces mesurables.................. 16 1.5 La tribu borélienne........................ 16 1.6 Compléments : π-système, λ-système, classe monotone.... 18 2 Mesure, espace mesuré 21 2.1 Définitions............................. 21 2.2 Propriétés élémentaires, caractérisation d une mesure finie.. 22 3 Prolongement d une mesure et applications 25 3.1 Théorème de prolongement (Carathéodory).......... 25 3.2 Mesure extérieure......................... 25 3.3 Application : la mesure de Borel................ 29 3.4 Ensembles négligeables, tribu et mesure complétée...... 29 3.5 Produit fini d une famille d espaces mesurés.......... 30 4 Applications mesurables 31 4.1 Définition d une application mesurable............. 31 4.2 Propriétés générales....................... 32 4.3 Propriétés des fonctions mesurables réelles........... 32 4.4 Fonction à valeur dans R = [, + ]............. 33 4.5 Transport d une mesure, mesure image............. 34 4.6 Approximation d une fonction mesurable réelle........ 34 3

5 Théorie de la mesure et probabilités 37 5.1 Introduction............................ 37 5.2 Exemples élémentaires...................... 38 5.2.1 Ensemble fini : Ω = {ω 1,...ω n }............. 38 5.2.2 Cas d un ensemble infini dénombrable Ω = {ω i, i N} 39 5.3 Probabilités conditionnelles, événements indépendants.... 39 5.4 Variables aléatoires........................ 41 5.4.1 Variables aléatoires réelles................ 41 5.4.2 Variables aléatoires, vecteurs aléatoires, indépendance 42 II Intégration 45 6 Intégration des fonctions mesurables positives 47 6.1 Intégrale (supérieure) des fonctions étagées.......... 47 6.2 Intégrale d une fonction mesurable positive.......... 49 6.3 Propriété vraie presque partout................. 50 6.4 Propriétés générales....................... 51 6.5 Théorème de transfert (changement de variable)....... 53 6.6 Mesures définies par des densités................ 54 6.7 Mesures absolument continues, étrangères........... 55 6.8 Absolue continuité et densité.................. 55 6.9 Théorème de changement de variable, λ mesure de Lebesgue. 56 6.10 Caractérisation de la mesure produit, théorème de Fubini- Tonelli............................... 57 7 Intégration des fonctions mesurables quelconques 61 7.1 Intégrale d une fonction mesurable............... 61 7.1.1 Définitions........................ 61 7.1.2 L ensemble L 1...................... 62 7.2 Propriétés générales....................... 62 7.2.1 Premières propriétés, lemme de Fatou......... 62 7.2.2 Théorème de la convergence dominée et applications. 63 7.2.3 Exemples......................... 66 7.3 Théorème de Fubini pour les fonctions mesurables quelconques 66 7.3.1 Le théorème de Fubini.................. 66 7.3.2 Exemples......................... 67 7.4 La convolution.......................... 68 7.4.1 Convolution de deux mesures.............. 68 4

7.4.2 Convolution d une fonction et d une mesure, de deux fonctions......................... 69 7.4.3 Exemples......................... 70 8 Théorie de l intégration et probabilités 71 8.1 Espérance et moments...................... 71 8.1.1 Espérance......................... 71 8.1.2 Moments......................... 72 8.1.3 Covariance et corrélation................ 72 8.1.4 Propriétés des moments................. 73 8.1.5 Inégalités......................... 73 8.2 Variable aléatoire réelle (vecteur aléatoire) et densité..... 74 8.3 Retour sur l indépendance.................... 74 III Compléments 77 9 Les espaces L p et L p, p N +{ } 79 9.1 Définitions des espaces L p.................... 79 9.1.1 Les espaces L p, p N.................. 79 9.1.2 Les espaces L, L................... 80 9.2 Propriétés des espaces L p, 1 p +............ 80 9.2.1. p est une norme.................... 80 9.2.2 Complétude des espaces L p............... 82 9.2.3 Autres propriétés..................... 83 9.3 Dual des espaces L p....................... 83 9.4 Quelques résultats d analyse fonctionnelle dans L 1 (R, B R, λ). 84 10 La transformée de Fourier 87 10.1 Définitions............................. 87 10.2 Propriétés générales....................... 88 10.3 Exemples............................. 88 10.4 Propriétés générales X = R d : théorèmes d injectivité et d inversion............................... 89 10.4.1 Théorème d injectivité.................. 89 10.4.2 Théorème d inversion.................. 91 10.5 Propriétés analytiques (sur R).................. 91 10.6 Transformée de Fourier dans L 1 : propriétés analytiques... 92 10.7 Transformée de Fourier dans L 2................. 93 5

Index 93 6

Introduction H. Lebesgue est généralement considéré comme le père de la théorie moderne de l intégration. Sa définition de fonction intégrable reste la plus satisfaisante à ce jour. On doit cependant également citer trois mathématiciens qui ont aidé Lebesgue à formuler son intégrale. Les deux premiers sont G. Peano et C. Jordan : G. Peano a défini le premier les notions de mesure intérieure et extérieure, tandis que C. Jordan est le premier à intégrer sur des ensembles distincts d intervalles, appelés ensembles Jordan-mesurables. Le troisième est le mathématicien E. Borel, qui définit les notions de tribus (boréliennes) et de mesures de Borel. C est la première apparition de mesures σ-finie sur un espace mesurable (et non une algèbre). Pourquoi H. Lebesgue a-t-il eu besoin de toutes ces notions? D ou viennent les notions de tribus, de mesure extérieure? Une réponse est la résolution du problème de Lebesgue, que nous aborderons rapidement. Nous discuterons ensuite brièvement des différences fondamentales entre intégrale de Riemann et intégrale de Lebesgue, avant d aborder le domaine des probabilités. Le cours sera ensuite divisé en 2 grandes parties : la théorie de la mesure, théorie abstraite qui sera ensuite appliquée à une nouvelle théorie de l intégration : l intégrale de Lebesgue. 7

Le problème de Lebesgue L objectif de Lebesgue est le suivant : tenter de généraliser la notion de longueur (aire, volume,...) à une famille de parties plus grandes que les intervalles (pavés). Plus précisément, il cherche une fonction vérifiant les 3 propriétés suivantes : invariance par translation σ-additivité λ( i I normalisation A i ) = i I λ : P(R n ) [0, + ] v R n, λ(a + v ) = λ(a) λ(a i ), I dénombrable, A i disjoints λ([0, 1] n ) = 1 1905 (Vitali) : le problème de Lebesgue n a pas de solution : il faut affaiblir les hypothèses. Deux solutions sont apportées. Elles conduisent à deux notions différentes de mesure : on demande seulement la σ-sous-additivité λ( i I A i ) i I λ(a i ), I dénombrable Une solution unique appelée mesure extérieure. On travaille sur un sous-ensemble B de P(R n ) : Une solution unique sur la tribu des boréliens appelée mesure de Borel ou mesure de Lebesgue (cette dernière étant en fait la mesure sur la tribu complétée). Intégrale de Riemann, intégrale de Lebesgue Concernant l intégration, l idée de Lebesgue est la suivante : plutôt que de définir les fonctions horizontalement par f(t), il définit les fonctions verticalement par f 1 (x). L intégrale est alors une somme sur les valeurs et non sur le support. 8

f(i) Riemann discret i [1,n] contre x.card(f 1 (x)) Lebesgue discret x R Les principales différences entre les deux intégrales sont alors les suivantes : Riemann mesure des intervalles A A Lebesgue mesure des boréliens B B A 1 A fonctions en escalier B 1 B fonctions étagées limite uniforme limite simple dominée fonctions réglées ( 0) fonctions mesurables ( 0) Mesures et probabilités La théorie des probabilités est une branche des mathématiques qui permet de modéliser les phénomènes aléatoires. Celle-ci repose sur une formalisation développée par le mathématicien russe Kolmogorov dans les années 1930. Son axiomatique repose sur les notions de tribu et de mesure développées par Borel dans les années 1900. La théorie de l intégrale de Lebesgue développée à la même époque a permis d asseoir en toute généralité la notion de moment d une variable aléatoire. Nous aborderons les relations entre la théorie de la mesure et de l intégration et la théorie des probabilités à la fin de chaque chapitre de ce cours. 9

10

Première partie Théorie de la mesure 11

Chapitre 1 Algèbres et tribus de parties d un ensemble Dans toute la suite, X sera un ensemble quelconque non vide. On note alors P(X) l ensemble des parties de l ensemble X. 1.1 Définitions Définition 1.1.1 (algèbre de Boole, ou de parties de X) A P(X) est une algèbre (de Boole) si pour tout A, B A : 1. {, X} A 2. A c = X\A A 3. A B A 4. A B A C est une semi-algèbre (notée S) si les conditions 1) et 3) sont vérifiées et que le complémentaire d un élément de S est réunion finie d éléments de S. On remarquera que certaines de ces conditions sont redondantes. Ainsi, par passage au complémentaire, si A contient l ensemble vide elle contient X et réciproquement. De même, 2) et 3) implique 4) et 2) et 4) implique 3). Remarque 1.1.2 L algèbre A engendrée par une semi-algèbre est constituée des réunions finies de parties de S. Définition 1.1.3 (σ-algèbre ou tribu) A P(X) est une tribu (sur X) si c est une algèbre stable par réunion dénombrable croissante. 13

Remarque 1.1.4 Une tribu est alors stable par réunion dénombrable et intersection dénombrable. Définition 1.1.5 (Espace mesurable) Un ensemble X muni d une tribu A P(X) est appelé espace mesurable et noté (X, A). 1.2 Tribu engendrée, tribu image réciproque Proposition 1.2.1 1) Toute intersection quelconque de tribus est une tribu. 2) Une réunion finie de tribus n est pas forcément une tribu. Preuve - 1) Soit (A i ) i I une famille de tribus. Montrons que i I A i est une tribu : (1) : i I, X A i, donc X i I A i (2) : soit A i I A i.alors i I, A A i donc i I, A c A i, et finalement A c i I A i. (3) : soit (A n ) n N une famille d éléments de i I A i. Alors n N, i I, A n A i, soit i I, A n A i et A n A i. n N n N i I 2) Soit X = {a, b, c}. Alors A a = {φ, {a}, {b, c}, X} et A b = {φ, {b}, {a, c}, X} sont des tribus. Mais A a A b = {φ, {a}, {b, c}, {b}, {a, c}} n est pas une tribu, car {a, b} = {a} {b} / A a A b. On en déduit la proposition suivante qui définit la notion de tribu engendrée : Proposition 1.2.2 (tribu engendrée) Soit M P(X). L intersection de toutes les tribus contenant M est une tribu appelée tribu engendrée par M et notée σ(m). C est la plus petite tribu contenant M. Cette proposition tient lieu de définition. Il est également possible de transporter une tribu par image réciproque d une fonction quelconque. Cette propriété vient de la compatibilité entre les opérations ensemblistes et la fonction d ensemble image réciproque : 14

1. f 1 (A c ) = f 1 (A) c 2. f 1 (A B) = f 1 (A) f 1 (B) 3. f 1 (A B) = f 1 (A) f 1 (B) De telles relations sont bien évidemment fausses concernant l image directe. Théorème 1.2.3 (tribu image réciproque) Soit Y un ensemble, (X, A) un espace mesurable et f : Y X une application. Alors 1. f 1 (A) = {f 1 (A), A A} est une tribu sur Y appelée tribu image réciproque par f (ou tribu engendrée par f) 2. (lemme de transport) M P(X), f 1 (σ(m)) = σ(f 1 (M)). Ce théorème tient lieu de définition. Preuve - 1) Montrons que B = f 1 (A) est une tribu. i- f 1 (X) = Y B. ii- A, B A, f 1 (A B) = f 1 (A) f 1 (B) donc B est stable par intersection fini. iii- A A, f 1 (A c ) = ( f 1 (A) ) c donc B est stable par passage au complémentaire. iv- f 1 ( n N A n ) = n N f 1 (A n ) donc B est stable par union dénombrable. Finalement, B = f 1 (A) est une tribu. 2) Soit M P(X). Nous allons montrer les deux inclusions : f 1 (σ(m)) est une tribu (cf point 1)) qui contient f 1 (M) donc σ(f 1 (M) f 1 (σ(m)). Posons R = {A σ(m), f 1 (A) σ(f 1 (M))}. Il est facile de voir que R est une tribu et que R contient M. On en déduit que σ(m) R ce qui implique f 1 (σ(m) σ(f 1 (M)). Finalement (σ(f 1 (M)) f 1 (σ(m)) σ(f 1 (M) et on a l égalité recherchée. 1.3 Exemples 1. L ensemble des pavés (produits d intervalles (a 1, b 1 ),..., (a p, b p )) de R p est une semi-algèbre. 15

2. σ( ) = {, X} est une algèbre appelée algèbre triviale (ou grossière : c est la plus petite des tribus sur X). 3. P(X) appelée tribu discrète (c est la plus grosse des tribus). 4. {A P(X), A ou A c fini} est une algèbre mais pas une tribu. 5. Soit X = {a, b, c} un ensemble formé de trois points distincts. Alors la classe de parties de X définie par τ a = {φ, {a}, {b, c}, X} est une tribu. 6. σ( ouverts de R n ) = B tribu des boréliens. Remarque 1.3.1 (importante) Une erreur fréquente est de croire que si A A et que B A, alors B A. C est faux comme le prouve l exemple de la tribu τ a où {b, c} τ a mais {b} / τ a, même si {b} {b, c}. 1.4 Produit d espaces mesurables Définition 1.4.1 (produit de deux espaces mesurables) Soient (X i, A i ), i = 1, 2 deux espaces mesurables : on appelle tribu produit sur X 1 X 2 la tribu A 1 A 2 engendrée par les parties {A 1 A 2, A i A i, i = 1, 2}. L espace mesurable (X 1 X 2, A 1 A 2 ) est appelé espace mesurable produit. Définition 1.4.2 (produit d une famille d espaces mesurables) Soient (X i, A i ), i I une famille d espaces mesurables : on appelle tribu produit sur Π X i la tribu A i engendrée par les parties i I i I { Π A i, A i A i i I et A i = X i sauf pour un nombre fini }. i I L espace mesurable ( Π X i, A i ) est appelé espace mesurable produit. i I i I 1.5 La tribu borélienne Définition 1.5.1 (tribu borélienne) Soit X un espace topologique. La tribu engendrée par les ouverts de X s appelle la tribu borélienne. Proposition 1.5.2 Sur X = R p la tribu borélienne est engendrée par : les ouverts les fermés les pavés 16

la démonstration de cette proposition est laissée en exercice. On peut notamment se servir des résultats qui suivent. Les questions de dénombrabilité interviennent naturellement dans la théorie des espaces mesurables boréliens, comme le montrent les propositions suivantes : Proposition 1.5.3 Soit X un espace topologique et (X n ) une famille dénombrable de boréliens de réunion X. Alors A B(X) n, A X n B(X n ) Preuve - L implication est directe car l ensemble A = {A P(X), A X n B(X n )} est une tribu contenant les ouverts de X donc la tribu engendrée par les ouverts i.e. la tribu borélienne. Pour la réciproque, notons B n = {A X n, A B(X)}. C est une tribu sur X n contenant les ouverts de X n (intersection d ouverts de X avec X n par définition), donc B(X n ) B n. Soit A A. Alors A X n B n B(X) et comme A = n N A X n, A est borélien comme union dénombrable de boréliens. Remarque 1.5.4 Cette caractérisation des boréliens est très importante puisqu elle permet d étendre des résultats vrais sur les (X n, B(X n )) a l espace mesurable (X, B(X)) tout entier. Le cas X = [0, + [, X n = [n, n + 1[ est un exemple important. Dans le cas d espaces topolgiques à base dénombrable d ouverts (i.e. tels qu il existe une famille dénombrable d ouverts engendrant tous les ouverts de X), on peut caractériser les boréliens uniquement à partir de cette base : Lemme 1.5.5 Si X admet une base dénombrable d ouverts, sa tribu borélienne est engendrée par cette base. Preuve - Soit A la tribu engendrée par cette base. Elle contient alors les réunions dénombrables des ouverts de la base et donc par définition, tous les ouverts. Finalement, elle contient la tribu borélienne. Réciproquement, la tribu borélienne contient la base d ouverts donc A, et les deux tribus coïncident. 17

Remarque 1.5.6 Si O 1 et O 2 sont deux bases dénombrables d ouverts de X 1 et X 2, alors O 1 O 2 est une base dénombrable d ouverts de X 1 X 2 Théorème 1.5.7 Soient X i, i = 1, 2 deux espaces topologiques à base dénombrable d ouverts. Alors la tribu produit des tribus boréliennes B 1 B 2 est la tribu borélienne de X 1 X 2 muni de la topologie produit. Preuve - Soient τ 1 et τ 2 les topologies (ou ouverts) de X 1 et X 2. Posons A 1 = {A P(X 1 ), A τ 2 B(X 1 X 2 )}. C est une tribu contenant τ 1 donc B(X 1 ) τ 2 B(X 1 X 2 )}. Posons alors A 2 = {A P(X 2 ), B(X 1 ) A B(X 1 X 2 )}. C est une tribu contenant τ 2 (d après le résultat précédent) donc B(X 1 ) B(X 2 ) B(X 1 X 2 )} puis par passage a la tribu engendrée, B(X 1 ) B(X 2 ) B(X 1 X 2 )}. - Montrons maintenant l inclusion inverse : Si O 1 et O 2 sont deux bases dénombrables d ouverts de X 1 et X 2, alors O 1 O 2 est une base dénombrable d ouverts de X 1 X 2 et σ(o 1 O 2 ) σ(o 1 ) σ(o 2 ). Finalement on conclut grâce au lemme précédent. On a prouvé au passage que la tribu produit est toujours (même sans l hypothèse de dénombrabilité) incluse dans la tribu borélienne de X 1 X 2. 1.6 Compléments : π-système, λ-système, classe monotone Il est souvent intéressant de travailler sur des familles plus simples que des tribus, et les notions suivantes seront donc utiles dans la suite : Définition 1.6.1 (π-système) Un π-système est une famille de parties de X stable par intersection finie et contenant X. Exemple 1.6.2 π = {], x], x R} est un pi-système très utile (cf. fonctions de répartitions). Définition 1.6.3 (λ-système) Un λ-système est une famille de parties de X stable par différence et limite croissante( (réunion dénombrable croissante). Définition 1.6.4 (classe monotone) Une classe monotone est une famille de parties de X stable par union (resp. intersection) dénombrable croissante (resp. décroissante). 18

Proposition 1.6.5 1. π-système et λ-système tribu. 2. algèbre et classe monotone tribu. 3. (lemme de Dynkin, ou théorème λπ) Tout λ-système contenant un π-système contient la tribu engendrée par ce dernier. 4. (théorème de la classe monotone) Toute classe monotone contenant une algèbre contient la tribu engendrée par cette dernière. Preuve - La démonstration des deux premières équivalences est laissée en exercice. [lemme de Dynkin] - Soit λ(π) le λ-système engendré par π (c est l intersection de tous les λ-systèmes contenant π). Alors λ(π) σ(π) car une tribu est un λ-système. Montrons que λ(π) est une tribu, i.e. est stable par intersection fini (d après 1)). On définit l ensemble A 1 = {A λ(π), A B λ(π) B π}. C est un λ-système contenant π donc λ(π) A 1. Soit maintenant A 2 = {A λ(π), A B λ(π) B λ(π)}. C est un λ-système contenant π d après le résultat précédent donc λ(π) A 2. Finalement λ(π) = σ(π). [théorème de la classe monotone] - Soit M(A) la classe monotone engendrée par A (c est l intersection de toutes les classes monotones contenant A). Alors M(A) σ(a) car une tribu est une classe monotone. Montrons que M(A) est une tribu, i.e. est une algèbre (d après 2)). On définit l ensemble A = {A M(A), A c M(A)}. C est une classe monotone contenant A donc M(A) A et M(A) est stable par passage au complémentaire. Soit A 1 = {A M(A), A B M(A) B A}. C est une classe monotone contenant A donc M(A) A 1. Soit A 2 = {A M(A), A B M(A) B M(A)}. C est une classe monotone contenant A d après le résultat précédent donc M(A) A 2 et M(A) est stable par union finie. Finalement M(A) = σ(a). 19

20

Chapitre 2 Mesure, espace mesuré 2.1 Définitions Contrairement a l intuition (et au vocabulaire), la définition d une mesure est au départ relative à un espace X muni d une algèbre A et non à un espace mesurable. Cependant, et ce sera l objet du prochain chapitre, il sera toujours possible d étendre univoquement une mesure (σ-finie) à la σ-algèbre engendrée par A, et donc de parler de mesure sur un espace mesurable. Définition 2.1.1 (Mesure sur une algèbre, espace mesuré) On appelle mesure sur l algèbre A toute fonction µ : A R + = [0, + ] non constante avec + et σ-additive : pour toute famille dénombrable A n d éléments de A deux à deux disjoints telle que n A n A, µ( n A n ) = n µ(a n ) L espace (X, A, µ) est appelé espace mesuré. Remarque 2.1.2 Un espace mesuré n est donc pas pour l instant obligatoirement mesurable. Nous verrons cependant qu il pourra toujours être considéré comme tel grâce au théorème de prolongement. Définition 2.1.3 La mesure est finie (ou bornée) si µ(x) < Elle est σ-finie si X est réunion dénombrable d ensembles de mesure finie. On appelle mesure de probabilité (ou simplement probabilité) toute mesure vérifiant µ(x) = 1. 21

Il est toujours possible de construire une mesure (sur une algèbre) à partir d une fonction d ensemble σ-additive sur une semi-algèbre : Lemme 2.1.4 Soit S une semi-algèbre et µ : S [0, + ] une fonction σ- additive. Alors µ se prolonge de manière unique en une mesure sur l algèbre engendrée par S. Preuve - Par additivité, le seul prolongement possible est n µ( A i ) = i=1 n µ(a i ) i=1 On vérifie aisément que c est bien une mesure sur l algèbre engendrée par S (composée des réunions finies d éléments de S). 2.2 Propriétés élémentaires, caractérisation d une mesure finie Toute mesure µ vérifie les propriétés suivantes : Proposition 2.2.1 1. µ( ) = 0. 2. (σ-sous-additivité) µ( n N A n ) n N µ(a n ). 3. (monotonie) Si A B, A, B A alors µ(a) µ(b). 4. (continuité) Si A n A A, µ(a n ) µ(a). Remarque 2.2.2 Nous verrons que cette dernière propriété caractérise les mesures. Preuve - 1. Une mesure n est pas constante égale à + donc il existe A, µ(a) < +. De µ(a) = µ(a ) = µ(a) + µ( ) on déduit µ( ) = 0. 2. On écrit : + n=1 A n = + n=1 ( A n \ n 1 k=1 A k ) 22

avec la convention : 0 A k = φ. Alors : k=1 ( + ) µ A n = n=1 + n=1 µ ( A n \ n 1 k=1 A k ) + n=1 µ (A n ). 3. De B = A B\A, on déduit : µ(b) = µ(a) + µ(b\a) µ(a). 4. On construit la suite (B n ) n 1 selon : Alors pour tout n 1, et donc B 1 = A 1 B n = A n \A n 1 pour n 2 + n=1 A n = A n = n k=1 B k + B k Comme les B n sont deux à deux disjoints par construction, on a : ( + ) ( + ) + µ A n = µ B k = µ(b k ) n=1 = lim k=1 n n k=1 Théorème 2.2.3 Une fonction k=1 k=1 µ(b k ) = lim n µ µ : A R + = [0, + ] ( n k=1 B k ) = lim n µ (A n) non égale à + et additive est une mesure si et seulement si elle vérifie la propriété de continuité croissante : A n A A µ(a n ) µ(a) Preuve - Nous avons déjà vu que toute mesure vérifie cette propriété. La n réciproque est évidente car si B n est une suite d ensemble disjoints, B i B n et la continuité croissante entraîne la σ-additivité. n N Il existe de plus une caractérisation très utile des mesures finies : 23 i=1

Théorème 2.2.4 Soit µ : A [0, + ] telle que : 1. (finitude) µ(x) < +. 2. (additivité) A, B A, A B =, µ(a B) = µ(a) + µ(b). 3. (Condition de Carathéodory) A n µ(a n ) 0. Alors µ est une mesure (finie par hypothèse) et réciproquement, toute mesure finie vérifie ces trois propriétés. Preuve - Pour la première partie du théorème, il nous faut montrer la σ- additivité de µ. Soit B i une famille dénombrable d ensembles de A deux à deux disjoints telle que B = + n B i A. Posons A n = B i = B\ B i. La suite A n i N décroît vers 0 donc µ(b\ i=1 par hypothèse (3). Mais d après (2) i=1 i=n+1 n B i ) 0 n + n n n µ(b) = µ([b\ B i ] [ B i ]) = µ(b\ B i ) + i=1 i=1 et la condition de carathéodory implique la σ-additivité µ(b) = + i=1 µ(b i ) i=1 n µ(b i ) Réciproquement, soit µ une mesure finie et A n. La continuité croissante implique µ(x\a n ) µ(x). Mais i=1 µ(x) = µ([x\a n ] [A n ]) = µ(x\a n ) + µ(a n ) et comme toutes les quantités sont finies, on a µ(a n ) = µ(x) µ(x\a n ) 0. 24

Chapitre 3 Prolongement d une mesure et applications 3.1 Théorème de prolongement (Carathéodory) Théorème 3.1.1 (de prolongement (admis)) Toute mesure σ-finie sur une algèbre A se prolonge de manière unique en une mesure (σ-finie) sur σ(a). La démonstration de ce théorème est hors programme. Cependant la notion de mesure extérieure est intéressante et est donc donnée ici. Le lemme d égalité des mesures est quant à lui fondamental. 3.2 Mesure extérieure Afin de prouver le théorème, on définit la mesure extérieure d une mesure µ : Définition 3.2.1 (mesure extérieure de µ) Soit µ une mesure sur une algèbre A X. Alors µ : P(X) [0, + ] A µ (A) = inf µ(a n ) {A A n n, A n A} est appelée mesure extérieure de µ sur X. Une partie A X sera dite µ -mesurable si E P(X), µ (E) = µ (E A) + µ (E A c ) n 25

Remarquons que µ prolonge µ sur A : Lemme 3.2.2 A A, µ (A) = µ(a) Preuve - Soit A n un recouvrement quelconque de A (A n A n, A n A). Alors µ(a) = µ( (A A n ) µ(a A n ) µ(a n ) par σ-additivité n N n N n N et monotonie. donc µ(a) µ (A). De plus, la famille A 1 = A, A 2 = A 3 =... = est un recouvrement de A donc µ (A) µ(a n ) = µ(a) et l égalité est prouvée. n N Proposition 3.2.3 µ est monotone et σ-sous-additive. Preuve - monotonie Soit A B. Alors tout recouvrement de B recouvre A et µ (A) µ (B) croissance Soit {A n, n N} une famille dénombrable et soit ɛ > 0 fixé. Alors Comme A n N, (B n k ) A, (k,n) N 2 B n k on a µ(bk n ) µ (A n ) + ɛ2 n k N µ (A) µ(bk n ) µ (A n ) + ɛ (k,n) N 2 n N et ɛ étant arbitraire, on obtient la σ-sous-additivité. Cette propriété des mesures extérieures associées aux mesures classiques peut d ailleurs servir de définition : Définition 3.2.4 (mesure extérieure) Une application Φ : P(X) [0, + ] est appelée mesure extérieure si : 1. Φ ( ) = 0. 2. (σ-sous-additivité) Φ ( A n ) Φ (A n ). n N n N 3. (monotonie) A, B A, A B Φ (A) Φ (B). 26

Le théorème de prolongement est alors une conséquence directe des lemmes suivants : Lemme 3.2.5 (lemme d égalité des mesures) Deux mesures sur (X, A) espace mesurable égales sur un π-système π A et σ-finies sur π sont égales sur σ(π). Preuve - Soit R = {A A, µ 1 (A) = µ 2 (A)}. Alors R contient π par hypothèse. Il suffit alors de montrer que R est un λ-système pour prouver le lemme en vertu du lemme de Dynkin. - Si µ 1 est finie alors µ 2 est finie car X π et l égalité µ(a\b) = µ(a) µ(b) vraie pour les mesures finies prouve que R est stable par différence. Si A n est une suite croissante d éléments de R de limite A, µ 1 (A) = lim µ 1 (A n ) = lim µ 2 (A n ) = µ 2 (A) - On suppose maintenant que µ 1 est σ-finie sur π, i.e. {π n }, µ 1 (π n ) < + n et (π n ) = X. n N Alors on peut appliquer le résultat precedent (lemme d égalité des mesures finies) aux espaces mesurables (π n, A π n ) ce qui prouve que les mesures µ 1 et µ 2 sont égales sur σ πn (π π n ). On montre (exercice) l égalité suivante : σ πn (π π n ) = σ X (π) π n Posons ( ) n 1 n N, Π n = π n ( π i ) c i=1 Alors Π n σ X (π) π n = σ πn (π π n ) et Π n = X, la somme étant n N disjointe. Finalement, ( ) A σ(π), µ 1 (A) = µ 1 Π n ) = n N(A µ 1 (A Π n ) n N = ( ) µ 2 (A Π n ) = µ 2 Π n ) n N n N(A = µ(a) 27

Le lemme d égalité des mesures est intéressant en lui même puisqu il permet de caractériser les mesures σ-finies uniquement par leur donnée sur un π- système. Dans le cas du π-système π = {], x], x R}, le théorème assure que deux mesures ayant la même fonction de répartition (F (x) = µ(], x])) sont égales. Lemme 3.2.6 L ensemble M des parties µ -mesurables est une tribu et µ est σ-additive (et donc une mesure) sur M. Preuve - Montrons tout d abord que M est une algèbre et que µ est finiment additive sur M. La stabilité par passage au complémentaire est évidente. Soient A, B M. Alors pour tout E P(X) : µ (E) = µ (E A) + µ (E A c ) = µ (E A B) + µ (E A c B) + µ (E A B c ) + µ (E A c B c ) µ (E A B) + µ (E (A B) c ) par sous-additivité de µ. Mais cette même sous-additivité donne µ (E) = µ (E (A B) E (A B) c ) µ (E A B) + µ (E (A B) c et finalement on a l égalité. Pour l additivité finie on prouve pour A et B disjoints l égalité renforcée : µ (E (A B)) = µ (E (A B) A) + µ (E (A B) A c ) = µ (E A) + µ (E B) Soit maintenant une suite de parties disjointes {A n, n N}. Alors on a n n µ (E) = µ (E ( A i )) + µ (E ( A i ) c ) = i=1 i=1 n n µ (E A i ) + µ (E ( A i ) c ) i=1 n i=1 i=1 µ (E A i ) + µ (E ( i N 28 A i ) c )

par monotonie. Le résultat étant vrai pour tout n, il vient µ (E) i N µ (E A i ) + µ (E ( A i ) c ) et par sous σ-additivité, µ (E) µ (E ( A i )) + i N i N µ (E ( A i ) c ). De nouveau la même sous σ-additivité donne également i N l inégalité inverse, et donc l égalité. Finalement, i N A i est µ -mesurable. La σ-additivité est alors une conséquence directe de l additivité finie et de la sous σ-additivité. Lemme 3.2.7 A M. La démonstration de ce lemme est laissée en exercice. 3.3 Application : la mesure de Borel Avant de construire la mesure de Borel, nous rappelons qu une fonction d ensemble additive µ 0 définie sur une semi-algèbre S admet un unique prolongement en une fonction additive µ sur l algèbre engendrée par S. Elle est définie par : n n µ( S i ) = µ 0 (S i ) i=1 pour toute famille finie disjointe. Corollaire 3.3.1 Par le théorème précédent, la mesure de Borel est l unique prolongement à la tribu des boréliens de la fonction longueur sur les intervalles de R (resp. à la fonction volume sur les pavés de R p ) étendue à l algèbre engendrée par les intervalles (resp. à l algèbre engendrée par les pavés). Théorème 3.3.2 (admis) Toute mesure borélienne invariante par translation est proportionnelle à la mesure de Borel. i=1 3.4 Ensembles négligeables, tribu et mesure complétée Définition 3.4.1 (ensemble négligeable, tribu complète) Soit (X, A, µ) un espace mesuré. On appelle ensemble négligeable (ou de mesure nulle) toute partie B P(X) telle qu il existe A A, B A et µ(a) = 29

0. On dit que la tribu A est complète (pour la mesure µ) si les ensembles négligeables sont mesurables. Remarquons qu en général l adjonction des ensembles négligeables élargit la tribu. Théorème 3.4.2 Il existe un unique prolongement de µ σ-finie à la tribu complétée A engendrée par A et l ensemble des ensembles négligeables tel que (A, µ) soit complet. (X, A, µ) est appelé espace complété. C est une conséquence directe du théorème de prolongement. Exemple 3.4.3 La mesure (resp. tribu) complétée de la mesure de Borel (resp. tribu borélienne) s appelle mesure (resp. tribu) de Lebesgue. 3.5 Produit fini d une famille d espaces mesurés Une autre application du théorème de prolongement est l existence et l unicité de la mesure produit sur le produit (fini) d espaces mesurés : Définition 3.5.1 (produit fini d une famille d espaces mesurés) Soient (X i, A i, µ i ), i I une famille finie d espaces mesurés σ-finis : on appelle mesure produit sur ( Π X i, A i ) l unique mesure µ i vérifiant i I i I i I µ i ( Π A i ) = Π µ i (A i ), i I i I i I A i A i i I L espace mesuré ( Π X i, i I i I A i, µ i ) est appelé espace mesuré produit. i I Remarque 3.5.2 Il existe une caractérisation différente de la mesure produit fondée sur les marginales qui sera donnée en abordant le théorème de Fubini. 30

Chapitre 4 Applications mesurables Ce chapitre, qui traite des applications mesurables, tient à la fois de la théorie de la mesure et de la théorie de l intégration. Si les notions définies et le théorème de la mesure image sont partie prenante de la théorie de la mesure, le théorème fondamental d approximation est en effet le point de départ de toute la théorie de l intégration de Lebesgue, celle-ci étant l intégration des fonctions mesurables. 4.1 Définition d une application mesurable Définition 4.1.1 (application mesurable) Soient (X, A) et (Y, B) deux espaces mesurables. Alors une fonction f : X Y est (A, B)-mesurable (ou simplement mesurable) si B B, f 1 (B) A Exemple 4.1.2 (fondamental) Posons Y = {0, 1} et B = P(X). Alors A X, 1 A est mesurable A est mesurable. Proposition 4.1.3 Si X et Y sont deux espaces topologiques, f continue f mesurable pour les tribus boréliennes Preuve - Soient τ X et τ Y les ouverts de X et Y. f continue f 1 (τ Y ) τ X. Par le lemme 1.2.3 (de transport), il vient f 1 (σ(τ Y )) = σ(f 1 (τ Y )) σ(τ X ) 31

Remarque 4.1.4 Dans le cas précédent où X et Y sont munis de leurs tribus boréliennes, les applications mesurables sont simplement appelées applications boréliennes. 4.2 Propriétés générales Proposition 4.2.1 1. Si B = σ(c), f mesurable { C C, f 1 (C) A}. 2. f : (X, A) (R, B R ) mesurable { x R, f 1 (], x]) A}. 3. Soit g : (Y, B) (Z, C) mesurable. Alors g f mesurable. 4. f : (X, A) (R, B R ) et g : (X, A) (R, B R ) mesurables (f, g) : (X, A) (R 2, B R 2) est mesurable. Preuve - 1. Conséquence directe du lemme 1.2.3 (de transport). 2. Application de 1) avec C = {], x], x R} (+ proposition 1.5.2). 3. (g f) 1 (C) = f 1 (g 1 (C)) f 1 (B) A. 4. [ ] R étant à base dénombrable d ouvert, on sait (1.5.5) que B(R 2 ) est engendré par cette base. D après 1), il suffit donc de prouver que l image réciproque d un produit d ouverts (les produits d ouverts forment une base) est dans A : (f, g) 1 (O 1 O 2 ) = f 1 (O 1 ) g 1 (O 2 ) et comme A est stable par intersection finie, (f, g) 1 (O 1 O 2 ) A. [ ] Les projections étant continues, f = p X (f, g) et g = p Y (f, g) sont mesurables d après la proposition 4.1.3 et 2). 4.3 Propriétés des fonctions mesurables réelles On appelle fonction mesurable réelle toute fonction f : (X, A) (R, B R ) mesurable (elle sera appelée variable aléatoire réelle en théorie des probabilités). Les propriétés de ces fonctions sont très importantes, et le calcul intégral développé par la suite sera presque entièrement dédié à ces fonctions mesurables réelles. 32

Proposition 4.3.1 Soient f : (X, A) (R, B R ) et g : (X, A) (R, B R ) mesurables et soit α R. Alors f + g, α.f, sup(f, g), inf(f, g), f sont mesurables. Soit {f n, n N} une suite de fonctions mesurables. Alors sup f n, inf n N n N f n, lim sup n N Si f n f, f est mesurable. f n, lim inf n N f n sont mesurables (dès que finies). Preuve - 1. La somme, le produit par un réel, le sup, l inf, la valeur absolue sont continues donc mesurables (proposition 4.2.1). On utilise ensuite les points 3) et 4) de la proposition 4.2.1. 2. montrons que le sup est mesurable en utilisant le point 2) de la proposition 4.2.1 : sup n N fn 1 (], x]) = {sup f n x} = {f n x} A n N n N 3. si f n f, alors f = lim sup f n = lim inf f n est mesurable d après n N n N 2). On en déduit directement le corollaire suivant : Corollaire 4.3.2 L ensemble M des applications mesurables réelles est un R espace vectoriel. 4.4 Fonction à valeur dans R = [, + ] L utilisation des suprema et infima est rendue malaisée par l interdiction des valeurs + ou. De plus, une mesure pouvant prendre la valeur +, l utilisation de mesures pour définir des fonctions peut être gênante. Afin de suppléer à ce problème, nous admettrons dans la suite du cours que l ensemble R = [, + ] peut être muni d une topologie correspondant à l intuition (c est à dire où les convergences sont les convergences classiques, y compris pour les suites convergeant vers + ou ). A partir de maintenant, nous travaillerons toujours (sauf précision) sur la droite réelle étendue R. Les théorèmes précédents restent alors valables. 33

4.5 Transport d une mesure, mesure image Proposition 4.5.1 (Mesure image) Soit (X, A, µ) un espace mesuré, f : (X, A) (Y, B) une application mesurable. Alors la fonction d ensemble ν : B [0, + ] B µ(f 1 (B)) est une mesure sur B appelée mesure image de µ par f et notée f µ. Preuve - f étant mesurable, pour tout borélien B de B, f 1 (B) A. on a trivialement ν( ) = 0 donc ν n est pas constante égale à +. Reste à vérifier la σ-additivité : Soit (A n ) n 1 une suite de boréliens deux à deux disjoints. Alors ( + ) ( ( + )) ( + ) ν A n = µ f 1 A n = µ f 1 (A n ) n=1 = + n=1 n=1 µ ( f 1 (A n ) ) = + n=1 n=1 ν (A n ) 4.6 Approximation d une fonction mesurable réelle Nous approchons ici toute fonction mesurable réelle par une suite de fonctions étagées. Le théorème d approximation est à la base du calcul intégral de Lebesgue, qui consiste à prouver des propriétés sur les fonctions étagées puis à passer à la limite. Définition 4.6.1 On appelle fonction étagée sur l espace mesurable (X, A) une fonction de la forme f = n x i 1 Ai, i=1 x i R, A i A Théorème 4.6.2 (fondamental d approximation) Toute fonction mesurable positive (f : X R + ) est limite d une suite croissante de fonctions étagées positives. 34

Toute fonction mesurable réelle est limite d une suite de fonctions étagées. Afin de prouver ce théorème, nous démontrons le lemme suivant : Lemme 4.6.3 soit f : (X, A) (R, B) une fonction mesurable réelle bornée par M. Alors il existe une fonction étagée g telle que 0 g f et sup x X f(x) g(x) M 2. Preuve - On vérifie que la fonction étagée possède les propriétés requises. g = M 2 1 {f> M 2 } On peut maintenant prouver le théorème : Preuve -(du théorème 4.6.2) 1. On suppose dans un premier temps que f est bornée. Alors par récurrence et en utilisant le lemme précédent 4.6.3, il existe une suite de fonctions étagées g n telle que n N, 0 g n f (g 1 +... + g n 1 ) et sup x X f(x) (g 1 (x) +... + g n ) M 2 n. La suite h n = g 1 +... + g n possède les propriétés voulues. Si f n est pas bornée, on pose f n = inf(f, n). f n f et les f n sont mesurables, positives et bornées. D après le résultat précédent, il existe g n étagée positive, sup x X f n (x) g n (x) 1 n. La suite h n = sup(g 1,..., g n ) possède alors les propriétés voulues. 2. On a f = f + f avec f + et f mesurables positives. Elles sont alors limites des suites de fonctions étagées g + n et g n et g + n g n converge vers f. Ce théorème permet de démontrer de nombreux résultats importants en théorie de l intégration. Il permet également de démontrer facilement le résultat suivant, qui est crucial pour la théorie de l esprérance conditionnelle et le calcul stochastique. Lemme 4.6.4 (de Doob) Soit h : E (F, F)et f : E (R, B) des applications. On munit E de la tribu σ(h) engendrée par h. Si f est σ(h) mesurable, alors il existe g (F,B) mesurable telle que f = g h 35

Preuve - La propriété est vraie pour les indicatrices Soit A B. Si f = 1 A, alors f 1 ({1}) = A σ(h) Or σ(h) = { h 1 (B); B F }. Donc il existe B dans F tel que A = h 1 (B). Donc f s écrit sous la forme f = 1 h 1 (B) = 1 B h = g h avec g = 1 B La propriété est vraie pour les fonctions étagées positives Si f est étagée positive, alors f = α i 1 Ai, donc i f 1 ({α i }) = A i σ(h) Donc il existe B i dans F tel que A i = h 1 (B i ). Donc f = i α i 1 Bi h La propriété est vraie pour les fonctions mesurables positives Soit f mesurable positive. Par le lemme fondamental d approximation, il existe une suite (s n ) n de fonctions étagées positives qui converge simplement en croissant vers f. Or, pour tout n, on peut écrire s n = g n X avec g n mesurable. Donc, g n h g h = f avec g = limg n. La propriété est vraie pour les fonctions mesurables à valeurs réelles. Cela résulte de la décomposition f = f + f. On applique le résultat précédent à f + et f. Il y a une petite difficulté car g + et g peuvent valoir, mais en multipliant par exemple g + par 1 g + <+, on élimine le problème sans changer g h. 36

Chapitre 5 Théorie de la mesure et probabilités 5.1 Introduction Il y a deux notions fondamentales en probabilités : Expérience aléatoire : expérience dont le résultat est soumis au hasard. Exemples : 1. jet aléatoire de deux dés, 2. battage d un jeu de n cartes, 3. jeu de Pile ou Face de durée infinie, 4. observation de la durée de vie d un appareil, 5. mouvement d une particule pendant un intervalle de temps [t 1 ; t 2 ]. Description mathématique : à l aide d un ensemble Ω dont les éléments ω représentent les issues possibles. Dans les exemples ci-dessus on peut prendre : 1. {1,..., 6} {1,..., 6}, 2. S n, n-ieme groupe symétrique, 3. {0, 1} N, ensemble des suites à valeurs dans {0, 1}, 4. N ou R +, 5. C([t 1 ; t 2 ], R 3 ). Événement aléatoire : événement lié à une expérience aléatoire. Par exemple, dans les situations précédentes : 1. amener un total supérieur ou égal à 10, 37

2. il n y a pas deux as consécutifs, 3. obtenir une série de cent pile consécutifs, 4. observer une durée de vie supérieure à deux ans, 5. la particule reste confinée dans la boule unité. Description mathématique : par la partie A de Ω égale à l ensemble des ω qui réalisent l événement. Ainsi dans l exemple 1. on aura A = {(5; 5); (5; 6); (6; 5); (6; 6)} Alors que le langage de la théorie de la mesure est ensembliste, celui des probabilités est (par définition) probabiliste. Il suffit alors de changer de terminologie pour transformer un énoncé de probabilité en théorie de la mesure, et réciproquement. Il est naturel de souhaiter que la classe des événements soit stable par les opérations contraire, et, ou appliquées à des suites éventuellement infinies d événements : il est alors naturel d imposer à cette classe, au niveau ensembliste, de former une tribu A de parties de Ω. Finalement, pour décrire complètement une expérience aléatoire, il reste à introduire la notion de probabilité i.e. de munir l espace mesurable (Ω, A) d une mesure de probabilité P (P(Ω) = 1). Ainsi, toute expérience aléatoire se décrit mathématiquement par la donnée d un espace probabilisé (Ω, A, P). 5.2 Exemples élémentaires 5.2.1 Ensemble fini : Ω = {ω 1,...ω n } On peut toujours supposer, quitte à remplacer par l ensemble des atomes de A (on rappelle que cet ensemble engendre A ), que A = P (Ω) la tribu discrète. Il est clair alors que grâce à la propriété d additivité (appelée ici axiome des probabilités totales ) définir P équivaut à définir une famille finie (p i ) de réels positifs tels que n i=1 p i = 1, en posant : P(ω i ) = p i. On a en effet alors A A, P(A) = P(ω i ) = p i ω i A i; ω i A En particulier, lorsqu il est question de tirage au hasard on sous entend que les probabilités des évenements sont équiprobables dans le sens ou P est la 38

probabilité uniforme définie par : P(ω i ) = p i = 1 n = 1 la formule précédente s écrit Card(Ω) de sorte que A A, P(A) = Card(A) Card(Ω). A ce niveau, il est clair que le calcul des probabilités se ramène à un calcul de dénombrement. 5.2.2 Cas d un ensemble infini dénombrable Ω = {ω i, i N} La remarque faite à propos du cas fini reste valable : on peut prendre A = P (Ω). Toute probabilité P sur (Ω, A) peut être définie par la donnée de la famille dénombrable {p i, i N} de réels positifs (vérifiant bien sûr : n i=1 p i = 1). On remarquera qu il n y a pas dans ce cas de probabilité uniforme possible. 5.3 Probabilités conditionnelles, événements indépendants Exemple : on tire une carte au hasard dans un jeu de trente deux cartes. On associe à cette expérience aléatoire l espace (Ω, A, P) où Ω est un ensemble à 32 éléments, A = P (Ω) et P la probabilité uniforme. On considère les événements A : tirer un roi noir, B : tirer un trèfle. On obtient immédiatement P(A) = 1 16 et P(B) = 1 4. Supposons que l on dispose de l information : la carte tirée est un roi noir ; il est raisonnable alors de prendre comme nouvel espace probabilisable (A, P (A)) muni de la probabilité uniforme P A. L événement tirer un trèfle se décrit maintenant par B = B A et P A (B ) = Card(B ) Card(A) = Card(B A) Card(A) = 1 2 = P(B A) P(A) Cette dernière égalité suggère aussi de garder l espace (Ω, P (Ω)) et de le munir d une nouvelle probabilité concentrée sur A, définie à partir de P. Définition 5.3.1 Soit (Ω, A, P) un espace probabilisé et A un événement de probabilité non nulle. On appelle probabilité conditionnelle d un événement B sachant A ou par rapport à A le nombre P(B A) défini par : P(B A) = P(B A) P(A) 39

Proposition 5.3.2 Soit (Ω, A, P) un espace probabilisé et A un événement de probabilité non nulle. L application P(. A) : A [0; 1] définie par B A, P(B A) = P(B A) P(A) est une probabilité sur (Ω, A). Définition 5.3.3 Soit (Ω, A, P) un espace probabilisé. Deux événements A et B sont indépendants si P(A B) = P(A)P(B) Les événements {A i, i I} sont (globalement, ou stochastiquement) indépendants si i 1,..., i k, P(A i1... A ik ) = P(A i1 )...P(A ik ) Remarque 5.3.4 Si A et B sont indépendants et si P(A) 0, on a P(B A) = P(B) De façon intuitive cela signifie que la réalisation de A n a pas d influence sur la probabilité de réalisation de B. Définition 5.3.5 n tribus (A 1,..., A n ) sont indépendantes si pour tout système (A 1,..., A n ) d événements tel que 1 i n, A i A i on a P( A i ) = Π n i=1p(a i ) 1 i n Une famille (potentiellement infinie) de tribus est indépendant si toute sousfamille finie est indépendante. On a bien la cohérence entre événements et tribus indépendantes : Définition 5.3.6 la famille d événements (A i, i I) est indépendante si et seulement si la famille de tribu (σ(a i ), i I) qu ils engendrent l est. Proposition 5.3.7 (lemme de Borel-Cantelli) Soit (Ω, A, P) un espace probabilisé et (A n ), n N une suite infinie d événements. 1. Si n N P(A n ) < + alors P(limA n ) = P(lim sup A n ) = 0, c est à dire que presque sûrement un nombre fini de A n au plus sont réalisés. 40

2. Si la suite (A n ) est indépendante et si n N P(A n ) = + alors P(limA n ) = P(lim sup A n ) = 1, c est à dire que presque sûrement une infinité de A n sont réalisés. En particulier pour une suite indépendante d événements : Corollaire 5.3.8 (loi du 0 1) Soit (A n ) une suite d événements indépendants. Alors P(lim sup A n ) = 0 ou 1 (suivant que n N P(A n ) converge ou diverge). 5.4 Variables aléatoires 5.4.1 Variables aléatoires réelles. Définition 5.4.1 (variable aléatoire réelle) Soit (Ω, A, P) un espace probabilisé. Une variable aléatoire (v.a.) réelle est une fonction mesurable X : (Ω, A) (R, B(R)). On dit que X est discrète si X(Ω) est fini ou dénombrable, entière si X(Ω) Z. Définition 5.4.2 (loi d une v.a. (ou distribution)) On appelle loi (de probabilité) de la v.a. X la mesure image de P par X, notée P X, qui est donc une probabilité sur R. B B(R)), P X (B) = P(X 1 (B)) = P(X B) Définition 5.4.3 On appelle fonction de répartition de P (resp. de X), notée F (resp. F X ) la fonction réelle F (x) = P(], x]) (resp. F X (x) = P X (], x]) = P(X x)) D après le lemme d égalité des mesures, elle caractérise entièrement la probabilité P (resp. la loi de X). Proposition 5.4.4 La fonction de répartition F d une variable aléatoire réelle X est croissante, cadlag (continue à droite limite à gauche), lim t F (t) = 0, lim t + F (t) = 1. 41

Réciporquement, si F : R R est une fonction croissante, continue à droite, de limites respectives 0 et 1 en et + alors il existe une unique probabilité P sur (R, B(R)) de fonction de répartition F. P est la mesure de Lebesgue-Stieljes associée à F. Définition 5.4.5 On dit que P est diffuse si F est continue ( P (x) = 0 x R). Elle est discrète si S dénombrable, P(S) = 1. Théorème 5.4.6 Toute probabilité est combinaison convexe d une probabilité diffuse et d une probabilité discrète. 5.4.2 Variables aléatoires, vecteurs aléatoires, indépendance Définition 5.4.7 (variable aléatoire) Soit (Ω, A, P) un espace probabilisé, (E, B) un espace mesurable. Une variable aléatoire (v.a.) sur (E, B) est une fonction mesurable X : (Ω, A) (E, B). Sa loi est la probabilité P X sur (E, B). Définition 5.4.8 (variable aléatoire à valeur dans R n ) Une v.a. à valeur dans R n est une fonction mesurable X : (Ω, A) (R, B(R n )). Sa loi est la probabilité P X sur (R, B(R n )). Proposition 5.4.9 a (R n ), a, X est alors une v.a. réelle et X est de la forme X = (X 1,..., X n ) où les X i sont des v.a. réelles. Définition 5.4.10 On appelle également X vecteur aléatoire. Les v.a. réelles X i = e i, X = p i X s appelle marges de X, leurs lois lois marginales de X. Attention : les marges déterminent X, mais les lois marginales ne déterminent pas P X en général. Tout comme pour les v.a. réelles, on peut définir la fonction de répartition d un vecteur aléatoire : Définition 5.4.11 On appelle fonction de répartition du vecteur aléatoire X, notée F X la fonction F X : R n [0, 1] n Elle définit entièrement X. F X (x 1,..., x n ) = P(X 1 x 1,..., X n x n ) 42

Définition 5.4.12 (v.a. indépendantes) Soit {X i, i I} une famille de v.a. définie sur (Ω, A, P) un espace probabilisé. les X i, i I sont indépendantes si les tribus image réciproque sont indépendantes. Théorème 5.4.13 Soit {X i, i I} une famille de v.a. définie sur (Ω, A, P). Alors les propositions suivantes sont équivalentes : 1. les X i sont indépendantes 2. i 1,..., i k, A ij A ij, P(X i1 A i1,..., X ik A ik ) = P(X i1 A i1 )...P(X ik A ik ) 3. i 1,..., i k, A ij A ij P (Xi1,...,X = P ik ) X i1... P Xik Dans le cas de vecteurs aléatoires on a : Proposition 5.4.14 Les X i sont indépendantes si et seulement si F (X1,...,X n)(x 1,..., x n ) = F X1 (x 1 )...F Xn (x n ) 43

44

Deuxième partie Intégration 45

Chapitre 6 Intégration des fonctions mesurables positives Dans ce chapitre, on se fixe une fois pour toute un espace mesuré (X, A, µ). 6.1 Intégrale (supérieure) des fonctions étagées On note E + l ensemble des fonctions étagées positives (à valeurs dans R + ). Définition 6.1.1 Soit f = n α i 1 Ai, α i R +, A i A i=1 une fonction étagée positive. Alors on définit l intégrale (supérieure) de f par rapport à µ comme I(f) = X fdµ = fdµ = n α i µ(a i ) i=1 Cette définition ne dépend pas de la décomposition choisie par additivité de la mesure. Remarque 6.1.2 On notera encore X fdµ = x X f(x)dµ(x). Cette intégrale peut avoir pour valeur +. On déduit de cette définition les premières propriétés de l intégrale de fonctions étagées : 47

Proposition 6.1.3 1 A dµ = µ(a), A A (f + g)dµ = fdµ + gdµ, f, g E + (additivité) αfdµ = α. fdµ, α R + (homogénéité) f g fdµ gdµ, f, g E + (croissance) La propriété cruciale de l intégrale des fonctions étagées est donnée par le lemme suivant : Lemme 6.1.4 (de Beppo-Levi) Soit f n une suite croissante d éléments de E + et f E +. Alors lim f n f lim f n dµ fdµ n + n + Preuve - Puisque lim n + f n f on a c ]0, 1[, A n = {f n cf} X De plus par définition de A n on a f n cf1 An et en écrivant f sous sa forme étagée Finalement f1 An dµ = N α i µ(a i A n ) i=1 lim n + f n dµ c N α i µ(a i ) = i=1 fdµ c [0, 1] (on peut faire tendre c vers 1 dans l inégalité). fdµ Corollaire 6.1.5 f n f X f n dµ fdµ, f n, f E + Preuve - La croissance de l intégrale donne f n dµ lim n + fdµ 48

et le lemme de Beppo-Levi donne l inégalité opposée f n dµ fdµ d où l égalité. lim n + 6.2 Intégrale d une fonction mesurable positive On note M + l ensemble des fonctions mesurables positives (à valeurs dans R + ). Définition 6.2.1 (intégrale (supérieure)) Soit f M +. On définit l intégrale (supérieure) de f par rapport à µ comme I(f) = fdµ = sup{ hdµ, h E +, h f} Remarque 6.2.2 Comparez cette définition aux notions de mesure extérieure, intérieure. Qu en déduisez-vous? Proposition 6.2.3 Soit h n E +, h n f (cf. théorème 4.6.2 d approximation). Alors I(f) = fdµ = lim h n dµ Preuve - Puisque n, h n E +, h n f on a n, h n dµ fdµ et par passage à la limite lim h n dµ fdµ n + Soit h E +, h f. Le lemme de Beppo-Levi donne h n dµ hdµ d où lim n + lim n + et finalement on a l égalité. h n dµ fdµ Les deux exemples suivants sont fondamentaux : le premier donne les séries comme intégrales par rapport aux mesures discrètes et le second voit l intégrale par rapport à la mesure de Borel comme une extension de l intégrale de Riemann. 49

Exemple 6.2.4 (Intégration par rapport à une mesure discrète) Une mesure discrète est de la forme µ(a) = i N p i 1 ai (A), p i > 0, a i X Alors f M +, I(f) = fdµ = i N p i f(a i ) Exemple 6.2.5 (Riemman et Borel) Si f M + est Riemman-intégrable, elle est Borel intégrable et les deux intégrales coincident. 6.3 Propriété vraie presque partout Un propriété P est vraie (µ) presque partout (P vraie p.p.) si elle est fausse sur un ensemble de mesure nulle. Exemple 6.3.1 χ Q = 0 p.p. pour la mesure de Borel. Lemme 6.3.2 f, M +, I(f) = 0 f = 0 p.p. f, g M +, f = g p.p. I(f) = I(g). Preuve - La première équivalence est évidente sur les fonctions étagées positives. Soit maintenant h n E +, h n f. Alors f = 0 p.p. n, h n = 0 p.p. n, I(h n ) = 0 et par le lemme de Beppo-Levi (et monotonie) 0 I(f) 0. Réciproquement par monotonie I(f) = 0 n, I(h n ) = 0 n, h n = 0 p.p. mais alors {f > 0} = + n=1 {h n > 0} est de mesure nulle comme réunion dénombrable d ensembles de mesure nulle. Enfin la deuxième implication est une conséquence de la première équivalence car f = g p.p. (f g)1 (f g) 0 = (g f)1 (g f) 0 = 0 p.p. et g + (f g)1 (f g) 0 = f + (g f)1 (g f) 0 50

d où I(g) = I(g) + I ( (f g)1 (f g) 0 ) d après l équivalence précédente = I ( g + (f g)1 (f g) 0 ) = I ( f + (g f)1(g f) 0 ) par linéarité = I(f) + I ( (g f)1 (g f) 0 ) = I(f) Ce lemme permet d étendre la définition de l intégrale aux fonctions définies p.p. Remarque 6.3.3 L ordre des quantificateurs est très important si on quantifie sur des ensembles non dénombrables (et pas important sinon). En effet : - Soit µ la mesure de Borel sur R. On définit f α (t) = 1, t α et f α (α) = 0. Alors α R, {f α = 1 presque partout} mais µ({ α R, f α = 1}) = µ( ) = 0 - Par contre, une union dénombrable d ensembles de mesure nulle étant de mesure nulle, on a n, {P n vraie p.p.} { n, P n } vraie p.p. 6.4 Propriétés générales Cette section présente deux résultats cruciaux : le théorème de convergence monotone et le lemme de Fatou. On donne également l inégalité de Markov. Théorème 6.4.1 L intégrale sur M + prolonge l intégrale sur E +. f f.dµ est additive, homogène et croissante. f n f f n dµ fdµ, f n, f M + (théorème de la convergence monotone (Beppo-Levi)). Le lemme de Fatou sera fondamental pour passer à la limite sous le signe. 51

Lemme 6.4.2 (lemme de Fatou (1ère version)) Pour toute suite f n M + on a (lim inf f n )dµ lim inf( f n dµ) n n Preuve - Soit h n = inf p n f p Alors h n est une suite croissante de limite lim n inf f n (par définition). Le théorème de convergence monotone donne lim n + h n dµ = lim inf f n dµ n D autre part on a et par monotonie h n f p p n h n dµ f p dµ p n d où et en passant à la limite, lim n + h n dµ inf p n h n dµ lim n f p dµ inf soit compte tenu de la première égalité lim inf f n dµ lim inf n n n f n dµ f n dµ Enfin, une petite inégalité très simple et très utile (notamment en probabilité) : Proposition 6.4.3 (Inégalité de Markov) Soit f M + (A) et a R +. Alors µ {x X : f(x) a} 1 fdµ. a X Preuve -Remarquer que f a1 {f a} puis intégrer. Remarquons qu en posant h = g f avec g strictement positive croissante (donc mesurable), on obtient ce qui peut paraître bien plus : µ {x X : f(x) a} 1 g fdµ. g(a) 52 X

6.5 Théorème de transfert (changement de variable) Soit (Y, B) un espace mesuré et φ : X Y une application (A, B)-mesurable. Soit ν = φ µ = µ(φ 1 ) la mesure image. Théorème 6.5.1 f : Y R +, f M + vérifie fdν = (f φ)dµ Preuve - Pour les fonctions indicatrices 1 B dν = ν(b) = µ(φ 1 (B)) = Y Y X X 1 φ 1 (B)dµ = X (1 B φ)dµ On en déduit que le théorème est vrai sur les fonctions étagées par linéarité puis sur les fonctions mesurables par convergence monotone. Cependant, il est pour l instant difficile de caractériser la mesure image. Exemple 6.5.2 (Loi de Cauchy) Soit λ la mesure de Borel sur ] π 2, π 2 [ et µ = λ π. Soit φ :] π 2, π 2 [ R θ tan θ alors la mesure image ν s appelle mesure (ou loi) de Cauchy. Elle vérifie pour h Riemman-intégrable R hdν = π 2 π h(tan θ)dµ(θ) 2 = 1 π π 2 π 2 h(tan θ)dθ = R h(t) dt π(1+t 2 ) Au vu de cet exemple, on aimerait pouvoir dire que, dans un certain sens ν = 1 π(1 + t 2 ) λ La prochaine section donne un sens à cette écriture. 53

6.6 Mesures définies par des densités Proposition 6.6.1 (définition) Soit f M +. L application ν : A R+ A 1 A fdµ est une mesure sur (X, A) appelée mesure de densité f par rapport à µ. On la note souvent ν = f.µ Preuve - On a bien évidemment ν( ) = 0 et ν n est pas constante égale à +. Elle est additive car si A 1 A, A 2 A sont deux ensembles disjoints, ν(a 1 A 2 ) = 1 A1 A 2 fdµ = (1 A1 + 1 A2 )fdµ = 1 A1 fdµ + 1 A2 fdµ = ν(a 1 ) + ν(a 2 ) Et finalement elle est continue par convergence monotone A n A 1 An f 1 A f 1 An fdµ 1 A fdµ On démontre alors facilement le théorème suivant (exercice) : Théorème 6.6.2 g M +, gd(f.µ) = gfdµ. Exemple 6.6.3 La loi de Cauchy définie précédemment est la mesure de 1 densité par rapport à la mesure de Borel sur R. π(1+x 2 ) Exemple 6.6.4 Posons f = +. Alors la mesure ν = f.µ est simple : elle vaut 0 sur les ensembles de µ mesure nulle et + sinon. Exemple 6.6.5 (Exemple fondamental des fonctions de répartition) Soit ν une mesure de probabilité, F sa fonction de répartition. On suppose que F est continuement différentiable et on note f sa dérivée (continue). Alors ν = f.λ 54

où λ est la mesure de Borel sur R. En effet, ν(], x]) = F (x) = x f(t)dt = 1 ],x] fdλ Les deux mesures (ν et f.λ) correspondant sur un π-systèmes, elles sont égales par le lemme d égalité des mesures. 6.7 Mesures absolument continues, étrangères On considère toujours (X, A, µ) espace mesurable, et soit ν une seconde mesure sur (X, A). Définition 6.7.1 On dit que ν est absolument continue par rapport à µ (et on note ν µ) si A A, µ(a) = 0 ν(a) = 0 On dit que ν et µ sont étrangères (et on note ν µ) si Exemple 6.7.2 N A, µ(n) = ν(n c ) = 0 ν = f.µ ν µ Sur (R, B(R)),toute mesure discrète est étrangère a la mesure de Borel. 6.8 Absolue continuité et densité Nous admettons alors les deux théorèmes suivants (théorème de Radon- Nikodym et théorème de décomposition de Lebesgue) : Théorème 6.8.1 (Radon-Nikodym (admis)) Si µ et ν sont σ-finies, ν µ, alors f mesurable positive, ν = f.µ de plus, f est unique à une µ-équivalence près. On note f = dν dµ l égalité g M +, gdν = g dν dµ dµ et on a 55

Il existe en fait une version plus générale de ce théorème : Théorème 6.8.2 (de décomposition de Lebesgue (admis)) Si µ et ν sont σ-finies, alors il existe f mesurable positive, unique à une µ-équivalence près et une unique mesure γ étrangère à µ telle que ν = f.µ + γ 6.9 Théorème de changement de variable, λ mesure de Lebesgue On peut désormais expliciter la forme de la mesure image dans le cas particulier de la mesure de Borel pour certaines fonctions φ. Soit X et Y deux ouverts de R n, λ la mesure de Borel sur R n et φ : X Y un C 1 -difféomorphisme (d où Y = φ(x)). Théorème 6.9.1 (changement de variable (admis)) ν = φ λ = λ(φ 1 ) est absolument continue par rapport à λ de densité dν dλ = Jac(φ) 1 = Jac(φ 1 ) Le théorème de transfert s écrit (f φ)dλ = X Y =φ(x) fdν = Y f Jac(φ 1 ) dλ où Jac(φ 1 ) est la fonction Jacobienne (ou Jacobien) de φ 1. On en déduit le changement de variable linéaire : Proposition 6.9.2 (Changement de variable liénaire) Soit A Gl d (R) et b R d. Alors pour toute f de L 1 ( R d, B ( R d)) R d f(ax + b)dx = 1 f(y)dy det(a) R d 56

Preuve - On pose φ : R d R d,x Ax + b. On peut encore écrire d φ (x 1,..., x d ) = a ij x j + b j ( ) φi Alors J φ (u) = det u j 1 i,j d j=1 Exemple 6.9.3 Soit f intégrable sur R d. Alors : f( x)dx = f(y)dy R d R d 1 j d = det (a ij ) 1 i,j d = det(a). D où le résultat. Remarque 6.9.4 Afin de démontrer le théorème de changement de variable, on procède de manière inverse. On montre d abord le théorème de changement de variable linéaire, puis on prouve le théorème général de changement de variable. 6.10 Caractérisation de la mesure produit, théorème de Fubini-Tonelli La définition de l intégrale permet de caractériser la mesure produit. Soit (X i, A i, µ i ), i = 1, 2 deux espaces mesurés, (X 1 X 2, A 1 A 2, µ 1 µ 2 ) l espace mesuré produit. Définition 6.10.1 (section) Soit A A 1 A 2 et soit f : (X 1 X 2, A 1 A 2 ) (Y, B) une application mesurable. s appelle section de A en x 1, A x1 := {x 2 X 2, (x 1, x 2 ) A} f x1 (.) := f(x 1,.) section de f en x 1. (on définit de même les sections de A et f en x 2.) Lemme 6.10.2 Soit A A 1 A 2 : 1. x 1 X 1, A x1 A 2 57

2. x 1 X 1, f x1 est (A 2, B) mesurable. 3. est (A 1, B( R + )) mesurable. Preuve - Soit x 1 X 1 fixé. h A : X [0, + ] x 1 µ 2 (A x1 ) 1. Soit C = {A A 1 A 2, A x1 A 2 }. C est stable par passage au complémentaire et par intersection dénombrable car (A c ) x1 = (A x1 ) c et ( A n ) x1 = n ) x1 n N n N(A C est donc une tribu. Elle contient les pavés (A 1 A 2, A 1 A 1, A 2 A 2 ) car et finalement, C = A 1 A 2. (A 1 A 2 ) x1 = A 2 si A 1 x 1 (A 1 A 2 ) x1 = si A c 1 x 1 2. on applique le résultat précédent à la section ( f 1 (B) ) x 1 = f 1 x 1 (B) pour tout ensemble mesurable B B. 3. Soit L = {A A 1 A 2, h A mesurable}. on vérifie aisément que L est un λ-système qui contient le π-système des pavés. On en déduit d après le lemme de Dynkin (proposition 1.6.5) que L = A 1 A 2. Théorème 6.10.3 (Fubini-Tonelli) A A 1 A 2 µ 1 µ 2 (A) = µ 2 (A x1 )dµ 1 (x 1 ) = X 1 µ 1 (A x2 )dµ 2 (x 2 ) X 2 Soit f : (X 1 X 2, A 1 A 2 ) ( R +, B( R + )) mesurable f dµ 1 µ 2 = X 1 X 2 = X 1 X 2 ( ) f x1 (x 2 )dµ 2 (x 2 ) dµ 1 (x 1 ) X ( 2 ) f x2 (x 1 )dµ 1 (x 1 ) dµ 2 (x 2 ) X 1 58

Preuve - Montrons que ν : A µ 2 (A x1 )dµ 1 (x 1 ) X 1 est une mesure sur (X 1 X 2, A 1 A 2 ). Soient A, B A 1 A 2 deux ensembles disjoints. Alors ν(a B) = µ 2 ((A B) x1 )dµ 1 (x 1 ) X 1 = µ 2 (A x1 Bx1 )dµ 1 (x 1 ) X 1 = [µ 2 (A x1 ) + µ 2 (B x1 )]dµ 1 (x 1 ) X 1 et par additivité de l intégrale, ν est additive. Soit (A n ) n N A 1 A 2 ) une suite croissante de limite A. Alors (A n ) x1 est également une suite croissante et ( A n ) x1 = n ) x1 d où par continuité n N n N(A des mesures µ 2 ((A n ) x1 ) µ 2 ((A) x1 ) et par continuité monotone de l intégrale, ν(a n ) ν(a) Elle n est pas constante égale à + car ν( ) = 0 et, d après le théorème 2.2.3, c est une mesure. Finalement, on vérifie que ν = µ 1 µ 2 sur les pavés et par le lemme d égalité des mesures (ou le théorème de prolongement), les mesures sont égales. Pour la deuxième partie du théorème, le résultat est vrai pour les fonctions indicatrices (c est l égalité des mesures précédentes) et donc par additivité et homogénéité sur les fonctions étagées. Soit maintenant f M + et h n E +, h n f. D après le lemme précédent (lemme 6.10.2) les fonctions (h n ) x1 et f x1 sont mesurables et on peut légitimement poser H n = (h n ) x1 dµ 2 et H = f x1 dµ 2. De plus la fonction H n est mesurable comme somme pondérée de fonctions mesurables par le 3ème point du lemme 6.10.2. Mais h n f H n H et H est mesurable comme limite de fonctions mesurables. 59

Finalement on a l égalité h n dµ 1 µ 2 = H n dµ 1 X 1 X 2 X 1 et par continuité monotone, on en déduit f dµ 1 µ 2 = X 1 X 2 X 1 H dµ 1 60

Chapitre 7 Intégration des fonctions mesurables quelconques Comme dans le chapitre précédent, on se fixe une fois pour toute un espace mesuré (X, A, µ). 7.1 Intégrale d une fonction mesurable L extension de l intégrale positive à M tout entier n est pas possible en général. Il faut considérer un sous-ensemble de M. 7.1.1 Définitions Définition 7.1.1 Soit f M, f = f + f. f est (µ)-intégrable si I(f + ) < +, I(f ) < + et alors l intégrale de f par rapport à µ est le nombre réel (fini) défini par I(f) = fdµ = I(f + ) I(f ) Définition 7.1.2 On désigne par L 1 (X, A, µ) (ou simplement L 1 (µ), L 1 ) l ensemble des fonctions µ-intégrables. Remarque 7.1.3 On dit que f M admet une intégrale si l une au moins des deux intégrales I(f + ), I(f ) est finie. on note encore cette valeur (possiblement ) fdµ. Toute fonction mesurable positive admet donc une intégrale, mais elle n est intégrable que si son intégrale est finie. 61

7.1.2 L ensemble L 1 Théorème 7.1.4 L 1 est un espace vectoriel et I : f I(f) = fdµ est une forme linéaire positive sur L 1. La démonstration de ce théorème est laissée en exercice. Théorème 7.1.5 Soit f M. Alors f L 1 fdµ f dµ f L 1 et Preuve - Soit f M, f = f + f. Alors l égalité f = f + + f et la linéarité de l intégrale donne le résultat. C est cette caractérisation des fonctions intégrables qui sera la plus utile en général. 7.2 Propriétés générales 7.2.1 Premières propriétés, lemme de Fatou Les résultats suivants sont basés sur des propriétés vraies µ p.p. Lemme 7.2.1 Soit f M, g L 1 M +. Alors f g p.p. f L 1 ( et I( f ) I(g)) Preuve - Soit φ + = f + 1 f g (resp. φ = f 1 f g ). Alors I(φ + ) I(g) (resp. I(φ ) I(g)) par monotonie de l intégrale supérieure. On utilise alors le lemme 6.3.2 qui nous donne I(f + ) = I(φ + ) I(g) et I(f ) = I(φ ) I(g). On en déduit que la fonction mesurable positive f est d intégrale finie inférieure à I(g). Corollaire 7.2.2 Soit f M, g L 1 (resp. admet une intégrale) : f = g p.p. f L 1 ( resp. admet une intégrale) et I(f) = I(g) Preuve - f g 0 p.p. f g L 1 et I( f g ) I(0) = 0 d après le lemme précédent. On en déduit que f L 1 car L 1 est un espace vectoriel et par linéarité de l intégrale, I(f) = I(f g) + I(g) = 0 + I(g) = I(g). 62

Lemme 7.2.3 (lemme de Fatou) Soit g L 1. Pour toute suite f n M on a f n g µ p.p. n (lim inf f n )dµ lim inf( n n f n dµ) f n g µ p.p. n (lim sup f n )dµ lim sup( n n f n dµ) Preuve - On remarque qu en changeant f n en f n la deuxième partie du lemme se déduit directement de la première partie. On va donc prouver uniquement la première inégalité : f n g µ p.p. n (lim inf f n )dµ lim inf( f n dµ) n n Ce théorème se prouve en deux étapes. étape 1 : On suppose que la majoration à lieu partout. Alors n N, f n g M + et l inégalité se déduit du lemme de Fatou pour les fonctions positives avec pour ) toute suite réelle u n et tout réel u : lim inf(u n u) = (lim inf u n u. n n étape 2 : Soit N = n N{f n < g} ; C est un ensemble de mesure nulle comme union dénombrable d ensembles de mesure nulle. on pose alors pour tout n N : f n = f n 1 N c + g1 N On a f n g donc d après l étape 1, (lim inf f n n)dµ lim inf( n f ndµ) Mais en dehors de l ensemble négligeable N, f n = f n et lim n inf f n = lim n inf f n et on conclut grâce au corollaire 7.2.2 précédent. 7.2.2 Théorème de la convergence dominée et applications Le théorème suivant, dit de convergence dominée, est un théorème crucial de la théorie de l intégration. Il est ici donné sous sa version forte, qui considère des convergences presque partout. 63

Théorème 7.2.4 (de convergence dominée de Lebesgue) Soit f n une suite de fonctions mesurables et g L 1, f n g µ p.p. Alors f n f µ p.p. f L 1 et f n dµ fdµ n. quitte à considérer la tribu complétée. Remarque 7.2.5 Pour éviter de considérer la tribu complétée, il suffit de rajouter l hypothèse suivante : f est mesurable. lim n Preuve - Tout comme pour le lemme de Fatou, la démonstration se fait en deux étapes. étape 1 : On suppose que la convergence à lieu partout. Quitte à raisonner séparément sur les f n + et fn, on peut supposer les f n positives. Alors f = lim inf f n = lim sup f n est mesurable et par le lemme de n n sup( Fatou, f n dµ) (lim sup f n )dµ = n fdµ = (lim inf f n )dµ lim inf( n n f n dµ) On conclut aisément qu il y a égalité et que l intégrale est finie du fait de l hypothèse de domination. étape 2 : On pose h sup = lim n sup f n et h inf = lim n inf f n. Soit N = n N{f n < g} {h inf < h sup } C est un ensemble de mesure nulle comme union dénombrable d ensembles de mesure nulle. on pose alors pour tout n N : f n = f n 1 N c On a f n g1 N c et f n h sup 1 N c = h inf 1 N c = f donc d après l étape 1, f est intégrable et f dµ = lim( f n ndµ) Mais en dehors de l ensemble négligeable N, f = f et f n = f n et on conclut grâce au corollaire 7.2.2 précédent si f est mesurable. On admet que si f n f µ p.p., alors f est mesurable sur la tribu complétée. 64

Remarque 7.2.6 Le théorème de convergence dominé est très souvent utilisé pour échangé limite et somme (dans les espaces normés, les limites sont séquentielles). Les théorèmes suivants de continuité et dérivation sous le signe sont des conséquences du théorème de convergence dominée. Soit T un intervalle de R, f : T X R telle que t T, f(t,.) soit A, B(R) mesurable. Soient finalement g 1, g 2 L 1 et t 0 T. Théorème 7.2.7 (Continuité) Si t T, f(t, x) g 1 (x) µ p.p. et si t f(t, x) est continue en t 0 µ p.p., alors h : t h(t) = f(t, x)dµ(x) est continue en t 0 Preuve - On remarque déjà que h(t) existe pour tout t d après le théorème de convergence dominée. Dire que h est continue en t 0 se traduit en terme de suite par : s n t 0, h(s n ) h(t 0 ) Le théorème de convergence dominée appliqué à la suite f n (.) = f(s n,.) donne le résultat. Théorème 7.2.8 (Dérivation) On suppose f(t,.) intégrable pour tout t. Si t f(t, x) est dérivable µ p.p. et que sur cet ensemble tf(t, x) g 2 (x), alors h : t h(t) = f(t, x)dµ(x) est dérivable sur T et d dt h(t) = f(t, x)dµ(x) t Preuve - Il suffit maintenant de montrer que pour toute suite s n t, s n t la suite h(sn) h(t) s n t tf(t, x)dµ(x). Pour cela, on applique le théorème de convergence dominée à la suite f n (x) = f(s n, x) f(t, x) s n t en remarquant que par le théorème des accroissements finis, f n g 2. On peut itérer ce processus pour dériver n fois en faisant attention de dominer toutes les dérivées. 65

7.2.3 Exemples 1. Dérivée d une série Soit u n une suite de fonctions dérivables sur I intervalle de R. On suppose que : la série de terme général u n (t) est absolument convergente pour tout t I u n v n avec v n terme général d une série (absolument) convergente. Alors la fonction S(t) = u n (t) n est dérivable de dérivée S (t) = n u n(t) 2. Transformée de Laplace Soit f une fonction borélienne bornée sur R +. Alors la fonction h(t) = + 0 e tx f(x)dx (appelée transformée de Laplace de f) est n-dérivable sur I =]a, + [ pour tout a > 0 de dérivée n-ième n t n h(t) = + 0 ( x) n e tx f(x)dx 7.3 Théorème de Fubini pour les fonctions mesurables quelconques 7.3.1 Le théorème de Fubini Théorème 7.3.1 (Fubini) Soit f : (X 1 X 2, A 1 A 2 ) ( R, B( R)) mesurable. Alors les 3 assertions suivantes sont équivalentes : 1. f est intégrable par rapport à µ = µ 1 µ 2 ; 2. x 1 f(x 1, x 2 ) dµ 2 (x 2 ) est intégrable ; 3. x 2 f(x 1, x 2 ) dµ 1 (x 1 ) est intégrable ; 66

et on a : f dµ 1 µ 2 = X 1 X 2 = X 1 X 2 ( ) f x1 (x 2 )dµ 2 (x 2 ) dµ 1 (x 1 ) X ( 2 ) f x2 (x 1 )dµ 1 (x 1 ) dµ 2 (x 2 ) X 1 Preuve - Pour l équivalence, on applique le théorème de Fubini-Tonelli à la fonction positive f et pour l égalité, aux fonctions positives f + et f. Remarquons que sous l une des hypothèses précédentes, la fonction f 1 : x 1 f(x 1, x 2 )dµ 2 (x 2 ) est seulement définie p.p. Elle est intégrable avec l abus de notation f 1 dµ = f 1 dµ X 1 {f 1 définie} La condition 2 du théorème de Fubini s écrit simplement dµ 1 f(x 1, x 2 ) dµ 2 (x 2 ) < + 7.3.2 Exemples 1. Séries Soit u n,m une suite sur N 2 telle que N 2 u n,m < +. Alors ( ) u n,m = u n,m = ( ) u n,m n,m N 2 n N m N m N n N C est l application du théorème de Fubini avec les mesures de comptage. 2. Intégrale d une série Soit f n une suite de fonctions mesurables. Alors si la série de terme général f n dµ 1 est absolument convergente, on peut intervertir somme et intégrale : ( ) f n dµ = ( ) f n dµ n N n N 67

3. Contre-exemple On considère µ 1 = µ 2 = λ non finie sur (R, B(R)). Soit g : [0, + [ R +, 0 < a = + 0 gdλ < + et g(0) = 0. On définit Alors + dλ(y) f(x, y) = g(x y)1 x y g(y x)1 x y + f(x, y)dλ(x) = mais f(x, y) n est pas intégrable : + dλ(y) + car la mesure n est pas finie. + f(x, y) dλ(x) = dλ(x) + + f(x, y)dλ(y) = 0 2a dλ(y) = + 7.4 La convolution La théorie de la convolution est une application de la théorie des mesures produits, du théorème de transfert et du théorème de Fubini. La convolution est une multiplication de mesures. Elle correspond à l addition de variables aléatoires indépendantes en probabilité. Pour cette théorie, X est une espace vectoriel topologique et B sa tribu borélienne. On suppose de plus l existence d une mesure λ σ-finie invariante par translation. 7.4.1 Convolution de deux mesures Définition 7.4.1 (produit de convolution) Soit µ et λ deux mesures σ-finies sur l espace mesurable (X, B). Alors on appelle produit de convolution µ ν la mesure image de µ ν par l application Σ : X X X (x, y) x + y Par le lemme de transfert et Fubini, il vient : 68

Proposition 7.4.2 µ ν(a) = = = 1 A (x + y)d(µ ν)(x, y) dµ(x) 1 A (x + y)dν(y) dν(y) 1 A (x + y)dµ(x) Le produit de convolution est donc commutatif. Il est également associatif. La démonstration de cette proposition est laissée en exercice. Proposition 7.4.3 Si f est µ ν-intégrable, fd(µ ν) = dµ(x) f(x + y)dν(y) = dν(y) f(x + y)dµ(x) Preuve - Il suffit de passer à la limite sur les fonctions étagées grâce à la proposition précédente. 7.4.2 Convolution d une fonction et d une mesure, de deux fonctions On définit alors de deux manières différentes la convolution d une fonction avec une mesure, ou encore de deux fonctions : Définition 7.4.4 (f ν) Soit f une fonction mesurable positive telle que µ = f.λ soit σ-finie. On appelle produit de convolution de f par ν la densité Si f = f + f alors f ν = d(µ ν) dλ f ν = f + ν f ν La convolution de deux fonctions est alors évidente : Définition 7.4.5 (f g) Soient f, g deux fonctions mesurables positives telles que µ = f.λ, ν = g.λ soient σ-finie. On appelle produit de convolution de f par g la densité f g = d(µ ν) dλ 69

Si f = f + f, g = g + g alors f g = f + g + + f g f g + f + g Dans le cas de mesures finies, on peut caractériser ce produit sous forme d une intégrale : Proposition 7.4.6 Si ν est finie, f et g λ-intégrables alors d(f.λ ν) (x) = (f ν)(x) = dλ f(x y)dν(y) d(f.λ g.λ) (x) = (f g)(x) = dλ f(x y)g(y)dλ(y) Preuve - Soit g µ λ-intégrable : d après la proposition, gd(µ ν) = dν(y) g(x + y)dµ(x) = dν(y) g(x + y)f(x)dλ(x) = dν(y) g(x)f(x y)dλ(x) par invariance par translation = dλ(x) g(x)f(x y)dν(y) par Fubini Et finalement en prenant pour g l indicatrice de n importe quel ensemble mesurable (g est alors intégrable car les mesures considérées sont finies), on obtient l égalité f.λ ν = f(. y)dν(y).λ. Le second résultat se déduit directement du premier. 7.4.3 Exemples 1. Si ν = µ est la mesure de Borel sur (R, B(R)), alors µ ν vaut 0 sur les ensembles négligeables et + sinon 2. Si µ et ν sont des mesures de probabilités, µ ν aussi. 70

Chapitre 8 Théorie de l intégration et probabilités 8.1 Espérance et moments 8.1.1 Espérance Soit X une variable aléatoire réelle sur (Ω, A, P). Définition 8.1.1 (espérance mathématique) Si X est intégrable, on appelle espérance de X (notée E(X) ou EX) l intégrale de X par rapport à P EX = X(ω)P(dω) Théorème 8.1.2 D après le théorème de transfert EX = X(ω)P(dω) = xp X (dx) L espérance d une v.a. ne dépend que de sa loi. Plus généralement, on à le résultat suivant : Ω Ω Théorème 8.1.3 Soit X : (Ω, A, P) (R, B(R)) une v.a. réelle, et φ : R R. Alors φ(x) est intégrable par rapport à P si et seulement si f est intégrable par rapport à P X et E (φ(x)) = φ X(ω)P(dω) = φ(x)p X (dx) Ω 71 R R

Exemples 1. Si X B(1, p), EX = 1.p + 0.(1 p) = p 2. Si P X est discrète, le calcul de EX est celui d une série EX = sp X (s) s S 3. Un v.a. suivant une loi de Cauchy de densité f(x) = 1 π(1+x 2 ) n admet pas d espérance. 8.1.2 Moments On définit (lorsqu ils existent) les moments d ordre p : Définition 8.1.4 (Moments) 1. EX p est le moment d ordre p 2. E[(X EX) p ] est le moment centré d ordre p 3. E[(X a) p ] est le moment centré en a d ordre p Le moment centré d ordre 2 s appelle la variance et est noté V X, sa racine carrée positive σ X s appelle l écart-type. 8.1.3 Covariance et corrélation Si X et Y sont deux v.a.r. de carré intégrable, on appelle - covariance entre X et Y le nombre cov(x, Y ) = E [(X EX)(Y EY )] - coefficient de corrélation entre X et Y le nombre ρ(x, Y ) = cov( X σ X, Y σ Y ) = cov(x, Y ) σ X σ Y La corrélation est comprise entre 1 et 1 (se démontre par l inégalité de Schwartz). Exemples : 1. Si X B(1, p) V X = (1 p) 2.p + (0 p) 2.(1 p) = p(1 p) 72

2. Si X suit une loi de Poisson de paramètre λ, elle admet une variance et V X = λ. 3. Un v.a. suivant une loi de Cauchy de densité f(x) = 1 π(1+x 2 ) n admet pas de moment d ordre p. 8.1.4 Propriétés des moments Proposition 8.1.5 1. EX p existe EX n existe n p 2. EX p existe E[(X a) p ] existe a R 3. V X = 0 a R, X = a P p.s. 4. V X = EX 2 (EX) 2 8.1.5 Inégalités - inégalité de Schwartz Si EX 2 et EY 2 existent, alors E XY existe et (E XY ) 2 EX 2 EY 2 - inégalité de Tchebychev Soit X une v.a. positive, g : R + R + strictement croissante (telle que E[g(X)] existe). alors - inégalité de Markov Soit X positive. - inégalité de Bienaymé-Tchebychev Soit X intégrable. P(X a) E[g(X)], a > 0 g(a) P(X a) EX a, a > 0 P( X EX a) V X a 2, a > 0 73

8.2 Variable aléatoire réelle (vecteur aléatoire) et densité Définition 8.2.1 (variable aléatoire à densité) Soit X une variable aléatoire réelle (resp. dans R n ), λ la mesure de Lebesgue sur R (resp. sur R n ). On dira que X est une variable à densité si sa loi est absolument continue par rapport à λ. Par le théorème de Radon-Nikodym, la densité est l unique fonction de L 1 + telle que P X (B) = P(X 1 (B)) = P(X B) = B fdλ On peut alors faire le lien entre fonction de répartition et densité : Théorème 8.2.2 P X est absolument continue (par rapport à la mesure de Borel sur R) si et seulement si il existe f positive λ-intégrable F X (x) = f(t)λ(dt), x R ],x] alors f = dp dλ dans L1 et F est λ presque partout dérivable de dérivée f. Pour les variables à densité, on a les formules suivantes pour l espérance : Si X est intégrable et de densité f EX = X(ω)P(dω) = xdp X (x) = xf(x)dλ Ω R Plus généralement si φ(x) est intégrable par rapport à P ( intégrable par rapport à P X ) E (φ(x)) = φ(x)f(x)dλ R φ est 8.3 Retour sur l indépendance Théorème 8.3.1 Soit {X i, i I} une famille de v.a. définie sur (Ω, A, P). Alors les propositions suivantes sont équivalentes : 1. les X i sont indépendantes 74

2. i 1,..., i k, A ij A ij, P(X i1 A i1,..., X ik A ik ) = P(X i1 A i1 )...P(X ik A ik ) 3. i 1,..., i k, A ij A ij P (Xi1,...,X ik ) = P X i1... P Xik 4. i 1,..., i k, g i1,..., g ik mesurables bornées E (g i1 (X i1 )...g ik (X ik )) = E (g i1 (X i1 ))...E (g ik (X ik )) Dans le cas de vecteurs aléatoires on a : Théorème 8.3.2 - les X i sont indépendantes si et seulement si F (X1,...,X n)(x 1,..., x n ) = F X1 (x 1 )...F Xn (x n ) - si les X i sont indépendantes et admettent des densités, (X 1,..., X n ) admet une densité donnée par f (X1,...,X n)(x 1,..., x n ) = f X1 (x 1 )...f Xn (x n ) - réciproquement, si (X 1,..., X n ) admet une densité donnée par f (X1,...,X n)(x 1,..., x n ) = g X1 (x 1 )...g Xn (x n ) et si les g i sont des densités, alors les X i sont indépendantes de densité respective g i. Théorème 8.3.3 Soit X, Y deux v.a. indépendantes. Alors 1. E(XY ) = E(X)E(Y ) ( Cov(X, Y ) = 0) 2. V (X + Y ) = V (X) + V (Y ) 3. P X+Y = P X P Y 4. Si X, Y sont de plus de densité respectives f et g, alors X + Y a pour densité f g 75

76

Troisième partie Compléments 77

Chapitre 9 Les espaces L p et L p, p N +{ } 9.1 Définitions des espaces L p Nous allons différencier 2 cas : p < + et p = +. Les démonstrations sont en général différentes selon ces deux cas, et les énoncés également. 9.1.1 Les espaces L p, p N On définit pour tout 1 p < + les fonctions suivantes :. p : M R + f I( f p ) 1 p = ( f p dµ) 1 p = f p Définition 9.1.1 On appelle espace L p l ensemble des fonctions mesurables telles que f p < + : L p = {f M, f p < + } Proposition 9.1.2 Pour tout 1 p < +, L p est un espace vectoriel et f p = 0 f = 0 p.p. f g p = 0 ( f = g p.p.) est donc une relation d équivalence. Preuve - Rappelons que x, y 0, (x + y) p 2 p (x p + y p ). En effet on a x 0, (1 + x) p 2 p (1 + x p ) : c est évident si x 1 et si x 1, il suffit de regarder 1 x. 79

En appliquant cette inégalité à f et g, on obtient f + g p 2 p ( f p + g p ) et par domination, f + g L p. L p est donc un espace vectoriel. Pour la deuxième proposition, on applique le lemme 7.2.1 aux fonctions f p et g p. Nous verrons plus loin que cette fonction. p est une semi-norme. Pour être une norme, il faudrait qu elle sépare les éléments. Une façon de résoudre ce problème est de passer à l espace quotient : Définition 9.1.3 L p = L p /. p est l espace des classes d équivalences des fonctions de L p égales presque partout. C est un espace vectoriel. 9.1.2 Les espaces L, L Les espaces L et L représentent les fonctions mesurables bornées presque partout (on dit quelquefois essentiellement bornées). Précisément on pose Définition 9.1.4 et. : M R + f inf(a R +, f a p.p.) = f L = {f M, f < + } L = L /. On a bien évidement la propriété suivante : Proposition 9.1.5 L et L sont des espaces vectoriels. 9.2 Propriétés des espaces L p, 1 p + 9.2.1. p est une norme Afin de prouver que. p est une norme sur L p il nous manque l inégalité triangulaire. Elle est conséquence des résultats suivants : Lemme 9.2.1 (inégalité de Jensen) Soit ν une mesure de probabilité. Si φ est convexe sur I intervalle de R, alors pour toute fonction f intégrable telle que f(x) I on a fdν I et φ( fdν) φ(f)dν 80

Preuve - Posons I = [a, b], a, b R. Soit m = fdν. On a a f b d où par monotonie de l intégrale et comme ν est une mesure de probabilité, a fdν b. Comme φ est convexe il existe une droite affine passant par φ(m) en m y = α(x m) + φ(m) situé sous la courbe de φ pour tout x I : x I, α(x m) + φ(m) φ(x) En intégrant cette inégalité il vient (α(f m) + φ(m))dν = φ(m) φ(f)dν Lemme 9.2.2 (inégalité de Hölder) soit 1 p, q, r + tels que 1 p + 1 q = 1 r. Alors f L p, g L q fg L r et fg r f p g q Preuve - Le résultat est évident si p ou q vaut + ou si f ou g est nulle. On suppose donc p et q finis et puisqu on ne considère que des valeurs absolues, f et g positives non nulles. Soit F = f p dµ et ν = 1 F f p.µ la mesure de probabilité de densité 1 F f p par rapport à µ. (fg) r dµ = f r p g r F dν = F (f p g q ) r q dν d après les hypothèses sur p, q, r F ( (f p g q )dν) r q par Jensen F 1 r q ( g q )dµ) r q ( f p )dµ) r p ( g q )dµ) r q On en déduit l inégalité triangulaire : 81

Lemme 9.2.3 (inégalité de Minkowski) Si f, g L p, f + g p f p + g p Preuve - On applique l inégalité de Hölder avec r = 1 à f, g L p et f + g p 1 L q. Le théorème suivant est alors évident : Théorème 9.2.4 (L p,. p ), 1 p + est un espace vectoriel normé. 9.2.2 Complétude des espaces L p On a en fait un résultat beaucoup plus fort, l espace normé est complet : Théorème 9.2.5 (L p,. p ), 1 p + est un espace vectoriel normé complet (i.e. un Banach). La complétude une conséquence des deux lemmes suivants : Lemme 9.2.6 Dans L p, toute série absolument convergente est convergente, i.e. et on a f n L p, + i=0 + i=0 f n p < + f n p + i=0 + i=0 f n p f n L p Preuve - Posons h N = N i=0 f n et h = lim sup h N = h N. Par le théorème de convergence monotone on a h p dµ = h p N dµ L inégalité triangulaire permet de majorer h p N dµ par [ + i=0 f n p ] p quelque soit N et finalement h p dµ. On en déduit que h N est presque partout fini et appartient à L p. Nous admettons le théorème suivant qui est un résultat classique d analyse fonctionnelle : Lemme 9.2.7 (admis) E espace normé est complet si et seulement si toute série absolument convergente est convergente. 82

9.2.3 Autres propriétés On peut également citer les propositions suivantes : Proposition 9.2.8 Soit 1 p < +. Si f n f µ p.p. et f n g L p n, alors f n f dans L p. Preuve - On applique le théorème de convergence dominée à la suite f n f p qui convergence p.p. vers 0 et est dominée par (2g) p. Proposition 9.2.9 (admis) Soit 1 p < +. Si f n f dans L p, alors on peut extraire de la suite f n une sous-suite convergeant µ p.p. vers f. Lorsque p = +, on a le résultat bien plus fort suivant : si f n f dans L, alors en dehors d un ensemble négligeable f n converge uniformément vers f (la démonstration de ce résultat est laissée en exercice). 9.3 Dual des espaces L p Théorème 9.3.1 L 2 muni du produit scalaire f, g L 2 espace de Hilbert. = fgdµ est un Preuve - On vérifie aisément que la forme est bilinéaire, symétrique et positive. L 2 est donc un espace prehilbertien complet d après le théorème 9.2.5, donc un Hilbert. Théorème 9.3.2 (admis) Soit 1 p +, q tel que 1 p + 1 q = 1. Alors D : L q (L p ) g D g : f gfdµ est une application linéaire continue. C est un isomorphisme si 1 p < +. La première partie du théorème se déduit directement de l inégalité de Hölder. Nous admettons l isomorphisme. 83

9.4 Quelques résultats d analyse fonctionnelle dans L 1 (R, B R, λ) Le premier résultat porte sur la convolution dans L 1. Théorème 9.4.1 (L 1, +,., ) est une algèbre de Banach commutative, autrement dit le produit de convolution est commutatif, associatif, distributif par rapport à l addition et f g 1 f 1 g 1 On a également l égalité f, g L 1, f gdλ = ( fdλ).( gdλ) Preuve - On utilise principalement le théorème de Fubini et de changement de variable (affine). Les théorèmes suivants portent sur la densité de certains espaces fonctionnels dans L 1. On utilise notamment la notion de noyau régularisant qui fait l objet de la définition suivante : Définition 9.4.2 On appelle noyau régularisant toute fonction ρ C à support compact vérifiant ρ 0, supp(ρ) BF (0, 1), ρ = 1 On appelle suite (resp. famille) régularisante toute suite ρ n = nρ(nx) (resp. ρ ɛ = 1 ɛ ρ( x ɛ )) Il n est pas évident que de tels noyaux régularisants existent. Un exemple est donné par le noyau ρ = avec φ(x) = exp( 1 )1 1 x 2 BF. φ φ 1 Lemme 9.4.3 L ensemble C c des fonctions continues à support compact est dense dans L 1. Preuve - Comme l ensemble des fonctions étagées intégrables est dense dans L 1, il suffit de montrer que toute indicatrice d un borélien de mesure fini peut être approchée (en norme 1) par une fonction continue à support compact. Soit A un tel borélien et ɛ > 0 fixé. On sait (cf TD) qu il existe un fermé 84

F et un ouvert O tel que F A O et λ(o\f ) ɛ. En remarquant que F = n BF (0, n) F et en utilisant la continuité croissante des mesures on peut supposer F compact. Or dans R (et plus généralement dans R d ) si F est compact et G(= O c ) est un fermé disjoint il existe une fonction continue nulle sur G et valant 1 sur F. Cette fonction φ ɛ est bien continue à support compact et vérifie 1 A φ ɛ 1 λ(o\f ) ɛ. On en déduit le résultat suivant très important en lui même et utile pour la démonstration des propositions qui vont suivre. Lemme 9.4.4 (continuité en moyenne) Soit f L 1, alors lim h 0 f(x + h) f(x) dx = 0 Preuve - On démontre facilement le résultat pour f continue à support compact (exercice). Pour f dans L 1 on utilise ensuite la densité de cet espace dans L 1 en décomposant f(x+h) f(x) dx f(x+h) f n (x+h) dx+ f n (x+h) f n (x) dx+ f n (x) f(x) dx Lemme 9.4.5 Soit ρ un noyau régularisant et f L 1. Alors f ρ n C et converge vers f dans L 1. Preuve - L appartenance à C découle du théorème de dérivation sous le signe somme. Comme ρ n = 1, on a (f ρ n )(x) f(x) = (f(x y) f(x))ρ n (y)dy d où f ρ n ) f 1 ( ρ n (y) ) f(x y) f(x) dx dy Soit ɛ fixé. D après le lemme de continuité sous la moyenne, il existe δ, y < δ f(x y) f(x) dx ɛ Mais ρ n est nulle à partir d un certain rang en dehors de la boule de rayon δ et on obtient la convergence. Corollaire 9.4.6 L ensemble C L 1 des fonctions indéfiniment dérivables est dense dans L 1. Finalement, on a la proposition suivante (qui est la plus forte) : 85

Proposition 9.4.7 L ensemble Cc support compact est dense dans L 1. des fonctions indéfiniment dérivables à Preuve - A l aide d une suite régularisante, on montre que C c Cc conclut par le lemme 9.4.3. et on 86

Chapitre 10 La transformée de Fourier Pour cette théorie, X est une espace vectoriel topologique et B sa tribu borélienne. On suppose de plus l existence de λ mesure σ-finie invariante par translation. En dehors des définitions générales, on aura X = R d et λ est la mesure de Lebesgue. On rappelle que pour intégrer une fonction à valeur complexes, ont peut intégrer séparément la partie réelle et la partie imaginaire (en identifiant C et R 2 ). 10.1 Définitions Définition 10.1.1 (Transformée de Fourier d une mesure finie) On appelle transformée de Fourier d une mesure finie µ sur (X, B) la fonction : F(µ)(x ) = µ(x ) = e 2iπ x,x (X,X) dµ(x) X Remarquons que cette définition à bien un sens car la fonction e 2iπ x,x (X,X) étant bornée (en module) par 1 pour tout x, elle est µ intégrable (la mesure µ est finie). En théorie des probabilité, on utilise plus généralement la fonction caractéristique : Définition 10.1.2 (Fonction caractéristique) On appelle fonction caractéristique d une mesure finie µ sur (X, B) la fonction : φ µ (x ) = F(µ)( x 2π ) = e i x,x (X,X) dµ(x) X 87

Définition 10.1.3 (Transformée de Fourier d une fonction intégrable) On appelle transformée de Fourier d une fonction f L 1 la fonction : F(f)(x ) = f(x ) = e 2iπ x,x (X,X) f(x)dλ(x) X Remarque 10.1.4 Sif = f + f, en notant µ + = f +.λ et µ = f.λ on a f = µ + µ. 10.2 Propriétés générales Proposition 10.2.1 1. La transformée de Fourier est linéaire. 2. La transformée de Fourier échange convolution et multiplication : µ ν(x ) = µ(x ) ν(x ) (idem pour la convolution d une fonction et d une mesure ou de deux fonctions). Preuve - La linéarité de la transformée de Fourier est une conséquence directe de la linéarité de l intégrale : µ + αν = e 2iπ x,x (dµ(x) + αdν(x)) = µ + α ν, α R + X Pour le second résultat, on utilise la proposition 7.4.2 : µ ν(x ) = e 2iπ x,x d(µ ν)(x) = X e 2iπ x,x+y dµ(x)dν(y) X 2 = e 2iπ x,x dµ(x) e 2iπ x,y dν(y) X X 10.3 Exemples Dirac : La transformée de Fourier de la mesure de Dirac ɛ a vérifie ɛ a (x ) = e 2iπ x,a (X,X). En particulier ɛ 0 (x ) = 1. on remarque que cette dernière égalité est compatible avec l échange entre convolution et produit pour la transformée de Fourier, et l égalité µ = ɛ 0 µ pour toute mesure finie µ. 88

Série de Fourier : Une série de Fourier est une série de terme général u n = a n e 2iπnx indicée par n Z. C est donc la transformée de Fourier de la mesure discrète µ = n Z a nɛ n. Mesure gaussienne : Soit µ la mesure gaussienne sur R d de densité g d,σ (x) = 1 (σ 2π) e x d 2σ 2 2 Sa transformée de Fourier vérifie ĝ d,σ (x ) = e 2π2 σ 2 x 2 10.4 Propriétés générales X = R d : théorèmes d injectivité et d inversion On suppose maintenant que X = R d et que λ est la mesure de Lebesgue. 10.4.1 Théorème d injectivité Théorème 10.4.1 (injectivité) 1. La transformée de Fourier µ caractérise la mesure finie µ (deux mesures finies ayant la même transformée de Fourier sont égales). 2. La transformée de Fourier f caractérise la fonction intégrable f λ-p.p. Une démonstration de ce théorème est fondée sur le lemme suivant : Lemme 10.4.2 Soit µ une mesure finie sur (R d, B R d) : 1. (g d,σ µ)(x) = R d µ(x )e 2iπ x,x 2π 2 σ 2 x 2 dλ(x ) 2. Pour toute fonction continue bornée h, (g d,σ µ)(x)h(x)dλ(x) σ 0 3. hdµ = lim σ 0 Preuve - - Remarquons d abord que X hdµ ( ) [h(x)dλ(x) µ(x 2iπ x,x 2π2σ2 x 2 )e dλ(x ) ]. X =R d g d,σ (x) = 1 (σ 2π) d ĝd, 1 2πσ ( x) 89

on a alors : (g d,σ µ)(x) = g d,σ (x y)dµ(y) 1 = (σ ĝ 2π) d d, 1 (y x)dµ(y) 2πσ ( 1 = (σ dµ(y) 2π) d ( = e 2iπ x,z 2π2 σ 2 z 2 dλ(z) ) g d, 1 (z)e 2iπ y x,z dλ(z) 2πσ ) e 2iπ y,z dµ(y) par Fubini - Pour la deuxième partie du lemme, on vérifie par des calculs simples que ( ) (g d,σ µ)(x)h(x)dλ(x) = dµ(y) h(y + σu)g d,1 (u)dλ(u) X Posons alors H σ (y) = h(y + σu)g d,1 (u)dλ(u) et soit C un majorant de h (bornée par hypothèse). Comme g d,1 est d intégrale 1 il vient H σ (y) C, y R d. Le théorème de convergence dominée appliqué à h(y+σ n u)g d,1 (u) (pour une suite σ n tendant vers 0) donne par continuité de h : H σ (y) h(y)g d,1 (u)dλ(u) = h(y) σ 0 En appliquant une seconde fois le théorème de convergence dominée à la suite H σn (y), on obtient le résultat voulu. - Enfin la troisième partie du lemme est une combinaison des deux premières parties. Preuve (du théorème d injectivité) - Il suffit de prouver le théorème sur les mesures, le théorème pour les fonctions se déduisant par linéarité avec µ = f.λ, f 0. D après le lemme 10.4.2, si on connaît µ on connaît également g d,σ µ, donc aussi hdµ pour toute fonction h continue et bornée. Mais pour tout pavé A = Π d i=1], a i ], il est facile d approcher simplement 1 A par une suite de fonctions continues bornées par 1. Le théorème de convergence dominée nous donne alors µ(a) = µ(a ) pour tout pavé A. Ces pavés formant un π-système, on conclut par le lemme d égalité des mesures. 90

10.4.2 Théorème d inversion On en déduit le théorème suivant : Théorème 10.4.3 (d inversion) Si la transformée de Fourier de µ, mesure finie, est intégrable, alors µ admet une densité continue et bornée par rapport à λ donnée par : dµ dλ (x) = R d µ(x )e 2iπ x,x dλ(x ) Si f est intégrable de transformée de Fourier intégrable, alors f(x) = f(x )e 2iπ x,x dλ(x ) = f( x) λ p.p. R d Preuve - Posons g(x) = R µ(x )e d 2iπ x,x dλ(x ). Puisque µ est intégrable, par le théorème de convergence dominée on peut échanger limite et intégrale dans l égalité ( ) hdµ = lim h(x)dλ(x) µ(x 2iπ x,x 2π2σ2 x 2 )e dλ(x ) σ 0 X =R d et finalement, hdµ = hgdλ pour toute fonction continue bornée. Le même raisonnement que pour la démonstration du théorème d injectivité nous donne alors l égalité des deux mesures sur le π-système des pavés et donc sur la tribu borélienne toute entière. 10.5 Propriétés analytiques (sur R). (Il existe des théorèmes analogues en dimension n qui sortent du cadre de ce cours). Proposition 10.5.1 (continuité, dérivabilité) Soit µ une mesure fini sur R. 1. F(µ) est continue. 2. si x est intégrable, alors F(µ) est Lipschitzienne. 3. Si x n est intégrable, n 1 alors F(µ) est n-fois dérivable et F(f) (k) (x ) = ( 2iπ) k x k e 2iπx x dµ(x) La démonstration est laissée en exercice. Utiliser les théorèmes 7.2.7 et 7.2.8. 91

10.6 Transformée de Fourier dans L 1 : propriétés analytiques Les résultats précédents s appliquent directement pour les fonctions intégrables. Mais on a également quelques résultats en plus que nous donnons dans cette section. On déduit notamment de la proposition et du théorème d inversion la propriété suivante : la transformée de Fourier échange dérivation et multiplication. Proposition 10.6.1 Si x n f et x n f sont intégrables alors f et f sont n-fois dérivable et on a : 1. xn f(x) = (2iπ) n f (n) (x) 2. f (n) (x) = (2iπ) n x n f(x) Proposition 10.6.2 (Comportement en + ) 1. Si f est intégrable, ˆf est continue et tend vers 0 en +. 2. Soit n 1, f C n et f, f,, f (n) intégrables (par rapport à la mesure de Lebesgue). Alors ( ) 1 F(f)(x ) = o x + x n 1 Preuve - On a déjà vu la continuité. Montrons la convergence. Soit t n. On a ˆf(t n ) = f(x)e 2iπtnx dx = f(x)e 2iπtn(x 1 2tn ) dx car e iπ = 1. En faisant le changement de variable u = (x 1 2t n ) et en ajoutant les deux expressions pour ˆf on obtient ( 2 ˆf(t n ) = f(x) f(x + 1 ) ) e 2iπtnx dx 2t n d où 2 ˆf(t n ) f(.) f(. + 1 2t n ) 1 qui tend vers 0 d après le théorème 9.4.4 de continuité en moyenne. La démonstration de la seconde partie de la proposition est laissée en exercice. Intégrer par parties. De manière synthétique, on peut donc écrire en posant C 0 =} l ensemble des fonctions continues de valeur nulle en } : 92

Théorème 10.6.3 L application est linéaire continue. F : (L 1,. 1 ) (C 0,. ) f f Preuve - On applique la proposition précédente pour montrer que l on tombe bien dans C 0. La linéarité est déjà prouvée et la continuité se réduit alors à ˆ(f) + f 1 (évident par majoration) 10.7 Transformée de Fourier dans L 2 Théorème 10.7.1 (admis) La transformée de Fourier est un isomorphisme de L 2 dans L 2. De plus, son inverse est donné par F 1 (f)(x) = F(f)( x) Ce théorème se déduit des lemmes suivants : Lemme 10.7.2 Soit f L 1 continue bornée. Alors f et f sont de carré intégrable et f L 2 = f L 2. Preuve - On utilise le lemme 10.4.2 et le théorème de Fubini. Lemme 10.7.3 (admis) L ensemble des fonctions intégrables, continues et à support compact est dense dans L 2. Ce théorème est en fait vrai pour tous les espaces L p, p < et la démonstration est identique au cas p = 1. Ce lemme, conjugué au lemme précédent (qui nous donne la continuité du morphisme F) nous permet d étendre la définition de la transformée de Fourier à l espace L 2 tout entier par prolongement d une application linéaire continue à valeur dans un espace complet. On vérifie ensuite que F est bien un isomorphisme par des résultats d analyse fonctionnelle. 93

Index λ-système, 18 π-système, 18 algèbre, 13 application borélienne, 32 mesurable, 31 classe monotone, 18 espace L p, 80 L p, 79 complété, 30 mesuré, 21 produit, 30 mesurable, 14 produit, 16 fonction étagée, 34 caractéristique, 87 inégalité de Hölder, 81 de Jensen, 80 de Markov, 52 de Minkowski, 82 intégrale, 49 supérieure, 49 lemme d égalité des mesures, 27 de Beppo-Levi, 48 de Doob, 35 de Fatou, 52, 63 de transport, 15 mesure, 21 étrangère, 55 extérieure, 25 absolument continue, 55 de densité, 54 image, 34 produit, 30 produit de convolution, 68 semi-algèbre, 13 théorème changement de variable, 56 de convergence dominée de Lebesgue, 64 de décomposition de Lebesgue, 56 de Fubini, 66 de Fubini-Tonelli, 58 de prolongement, 25 de Radon-Nikodym, 55 fondamental d approximation, 34 transformée de Fourier, 87 tribu, 13 borélienne, 16 complète, 30 engendrée, 14 image réciproque, 15 94