Université Pierre et Marie Curie 03-04 Probabilités et statistiques - LM345 Feuille 7 (semaine du 8 au 3 octobre Sommes de variables aléatoires indépendantes.. Indépendance d événements et de variables aléatoires. a Donner un exemple d un espace de probabilité et de trois événements A, B, C sur cet espace de probabilité tels que P(A B C P(AP(BP(C mais tels que A, B, C ne soient pas indépendants. b Déterminer à quelle condition une variable aléatoire réelle est indépendante d ellemême. On pourra étudier sa fonction de répartition. Solution de l exercice.a On prend Ω {,, 3, 4, 5} muni de F P(Ω. On choisit A : {, 4} B : {,, 4}, et C : {3, 4}. On a alors A B A, A C B C A B C, ce qui entrainera que si on a P(A B C P(AP(BP(C avec P(A, P(B et P(C dans ]0, [, alors on aura aussi P(A B P(A P(AP(B, P(A C P(AP(C et P(B C P(BP(C. On peut choisir par exemple P(A /3, P(B / et P(C /, ce qui donne la solution suivante au problème : P({4} P(A B C P(AP(BP(C /, P({} P(A P({4} /4, P({} P(B P(A /6, P({3} P(C P({4} 5/, P({5} P({,, 3, 4} /. Autre possibilité, parmi de nombreuses autres : on considère le lancer d une pièce, et A {le résultat est pile}, B {le résultat est face}, C. Clairement P(A B C 0 P(AP(BP(C, et A et B ne sont pas indépendants donc A, B, C ne le sont pas. b Soit X une variable aléatoire indépendante d elle-même. Pour tout x R, on a P(X x, X x P(X xp(x x, donc P(X x P(X x, donc la fonction de répartition de X ne prend que les valeurs 0 ou. Posons a sup{x R : P(X x 0}. Pour tout x < a, il existe t tel que x < t a et P(X t 0 (sinon, x serait un majorant strictement plus petit que a de l ensemble {x R : P(X x 0}. Donc P(X x P(X t 0. Par ailleurs, pour tout x > a, on a P(X x > 0 (sinon a ne serait pas un majorant de {x R : P(X x 0}, donc P(X x. Par continuité à droite de la fonction de répartition de X, on a donc P(X x [a,+ [ (x. C est la fonction de répartition de la loi constante égale à a, donc X est une variable aléatoire constante. Réciproquement, soit X une variable aléatoire constante égale à c. Soient A et B deux boréliens de R. Les deux nombres P(X A, X B et P(X AP(X B valent
si et seulement si c A B, et 0 sinon. Dans tous les cas, ils sont égaux, donc X est indépendante d elle-même. Finalement, une variable aléatoire est indépendante d elle-même si et seulement si elle est constante presque sûrement.. Soient E {x, x, x 3 } et F {y, y, y 3 } deux parties finies de R. Pour chacune des matrices P (P ij i,j,,3 ci-dessous, on considère un couple (X, Y de variables aléatoires à valeurs dans E F tel que pour tous i, j {,, 3}, on ait P(X x i, Y y j P ij. Déterminer si les variables aléatoires X et Y sont indépendantes. 3 3 0 0 0 0 4 4 3 3 4 3 3 P 0 0 0, P 3, P P. 7 7 7 5 0 60 5 0 0 0 0 0 0 6 (cf. Examen 0, exercice Solution de l exercice. Dans chaque cas, on commence par calculer la loi de X et la loi de Y, en utilisant les relations P(X x i P(X x i, Y y +P(X x i, Y y +P(X x i, Y y 3 P i +P i +P i3, P(Y y j P(X x, Y y j +P(X x, Y y j +P(X x 3, Y y j P j +P j +P 3j. On examine ensuite si pour tous i, j on a P ij P(X x i P(Y y j. C est le cas pour les trois premières matrices mais pas pour la quatrième. 7 60 7 60 7 480 4 0 4 3. Soit (Ω, F, P un espace de probabilité. Soit (X n n une suite de variables aléatoires indépendantes définies sur (Ω, F, P, toutes de loi de Bernoulli de paramètre p ]0, [. a On définit, pour tout n et tout ω Ω, S n (ω le nombre d entiers k {,..., n} tels que X k (ω. Déteminer la loi de S n. Les variables (S n n sont-elles indépendantes? b On définit, pour tout ω Ω, T (ω min{n : X n (ω }, avec la convention min +. Calculer P(T + puis déterminer la loi de T. c On définit maintenant, pour tout ω Ω, T (ω min{n > T (ω : X n (ω }. Déterminer les lois de T et de T T. Les variables T et T sont-elles indépendantes? Qu en est-il des variables T et T T?
Solution de l exercice 3. a On remarque que S n X + + X n est la somme de n variables aléatoires de Bernouilli de paramètre p, elle suit donc la loi binomiale de paramètre n et p. Les variables (S n n ne sont pas indépendantes. Pour le voir on peut remarquer que S n+ S n X n+. Ainsi P(S n+ S n 0. Donc P(S n+ et S n 0 0. Or si n, P(S n+ P(S n 0 > 0 ce qui montre qu il ne peut y avoir indépendance. b Soit k un entier. Par indépendance des X n, on a : P(T k P(X X k 0, X k P(X 0... P(X k 0P(X k p( p k. On vérifie immédiatement que P(T < + k P(T k, et donc que P(T + 0. T suit dont une loi géométrique (modifiée de paramètre p (ou p selon les conventions : il s agit du temps de premier succès. c Soient j et k des entiers. P(T j, T k 0 si k j. On suppose donc maintenant k > j. P(T j, T k P(X X j 0, X j, X j+ X k 0, X k P(X 0... P(X j 0P(X j P (X j+ 0... P(X k 0P(X k p ( p k. On fixe k et on somme l égalité précédente pour j,..., k, ce qui donne P({T k (k p ( p k. Là encore, on peut sommer sur k pour vérifier que P(T + 0. T prend toutes les valeurs {,, 3,...} avec probabilité strictement positive, et T les valeurs {, 3, 4,...}. Comme P(T < T, T et T ne peuvent pas être indépendantes (par exemple parce que P(T, T 0 < P(T P(T. En posant k i + j, on obtient P(T j, T T i P(T j, T k p ( p k p( p j p( p i. En sommant sur j, on obtient P(T T i p( p i et on remarque que P(T j, T T i P(T j P(T T i. T T a donc la même loi que T et est indépendante de T. 4. (Examen 0, ème session Soit (X, Y un vecteur aléatoire dont la loi admet la densité f (X,Y (x, y x e x y x ]0,+ [ (x ]0,+ [ (y par rapport à la mesure de Lebsegue sur R. 3
a Déterminer la densité de X. Quelle est le nom de cette loi? b Calculer, pour tout entier n 0, l intégrale 0 x n e x dx c Calculer, pour tout entier n, l espérance de Y n. d Les variables X et Y sont-elle indépendantes? e On pose (T, Z ( X, Y X. Déterminer la loi du vecteur (T, Z. Solution de l exercice 4. cf corrigé de l exercice de la deuxième session d examen 0 5. Lois discrètes classiques Calculer, de deux manières différentes, la loi de : a la somme de deux variables aléatoires indépendantes, l une de loi de binomiale de paramètres n et p, l autre de paramètres m et p, où p [0, ] et m, n sont deux entiers. b la somme N +...+N p où les N i sont indépendantes et où N i suit une loi de Poisson de paramètre λ i. Solution de l exercice 5. Loi binômiales On peut procéder de plusieurs façons.. On sait que la loi binomiale de paramètres n et p est la loi de la somme de n variables aléatoires indépendantes de loi de Bernoulli de paramètre p. Soient X,..., X n+m des variables aléatoires indépendantes identiquement distribuées de loi de Bernoulli de paramètre p. Posons Y X +... + X n et Z X n+ +... + X n+m. Alors Y et Z sont indépendantes, de lois respectives B(n, p et B(m, p. Leur somme, qui est Y + Z X +... + X n+m, suit la loi B(n + m, p.. Soient Y et Z indépendantes de lois respectives B(n, p et B(m, p. Les fonctions génératrices de Y et Z sont G Y (s ( p + sp n et G Z (s ( p + sp m. Puisqu elles sont indépendantes, la fonction génératrice de leur somme est G Y +Z (s E[s Y +Z ] E[s Y ]E[s Z ] ( p + sp n+m. On reconnaît la fonction génératrice de la loi binomiale de paramètres n + m et p. Lois de Poisson La réponse est que N +... + N p suit une loi de Poisson de paramètre λ +... + λ p. A nouveau deux approches sont possibles : On calcule d abord la loi de N + N : k k P(N + N k P((N + N k (N l P((N k l (N l l0 k P(N k lp(n l etc. l0 4 l0
et on montre que P(N + N k e λ λ (λ +λ k k!, puis on conclut par récurrence. On calcule la fonction génératrice de fonction génératrice de N + N +... + N p directement (qui est le produit des fonctions génératrices, par indépendance, et on reconnaît la fonction génératrice de P(λ +... λ p. 6. Somme de gaussiennes Soient X et Y des variables aléatoires indépendantes de lois respectives N (µ, σ et N (µ, σ. Soient a, b et c des réels. Déterminer la loi de ax + by + c. Solution de l exercice 6. Soit g une fonction continue bornée R R. E[g(X + Y ] πσ σ + + e (x µ σ (y µ σ g(x + ydydx. On fait le changement de variable affine u x + y dans l intégrale par rapport à y : E[g(X + Y ] πσ σ + + e (x µ σ (u x µ σ g(ududx. On écrit le trinôme dans l exponentielle sous forme canonique : (x µ σ + (u x µ σ σ + σ σ σ [ (x λu ] + µ σ + (u µ σ σ + σ λ σ u, σ avec λ u : σ µ +σ (u µ. σ +σ En développant λ u, on obtient µ σ µ σ µ + (u µ σ + σ λ σ σσ u ( σ + (u µ σ + σ σ + (u µ µ (u µ σ + σ σ + σ σ + σ Autrement dit, le trinôme de l exponentielle s écrit ( σ µ (u µ σ + σ σ + σ (u µ µ. σ + σ (x µ σ + (u x µ σ σ + σ σ σ [ (x λu ] + (u µ µ. σ + σ En remarquant que pour tout u R, le changement de variable affine x x λ u donne + e σ +σ σ (x λ u + σ dx e σ +σ σ x πσ σ dx σ, σ + σ 5
on obtient, en changeant l ordre d intégration : E[g(X + Y ] πσ σ + + π(σ + σ + e (u x µ σ dxe (u µ µ (σ +σ g(udu e (u µ µ (σ +σ g(udu. X + Y suit donc la loi N (µ + µ, σ + σ. La question était de déterminer la loi de ax + by + c. On va montrer que ax + c suit la loi N (aµ + c, a σ, ce qui, appliqué aussi à by et combiné avec le calcul précédent, permet de conclure que ax + by + c suit la loi N (aµ + bµ + c, a σ + b σ. Pour le voir, considérons une fonction g : R R continue et bornée. On a E[g(aX + c] + πσ e (x µ σ g(ax + cdx. On fait le changement de variable u ax + c (la valeur absolue vient du fait que lorsque a < 0, on échange les bornes d intégration : E[g(aX + c] + πσ πa σ + e ( u c a µ σ g(u du a e (u c aµ a σ g(udu. Ce qui achève la démonstration. 7. Soit (Ω, F, P un espace de probabilité. Soient N, X, X,... : (Ω, F, P N des variables aléatoires indépendantes. On suppose que N suit la loi de Poisson de paramètre λ > 0 et que X, X,... sont identiquement distribuées. On pose R X +... + X N, c est-à-dire, pour tout ω Ω, R(ω N(ω k X k (ω. a - Si N et X n sont de carré intégrable, en déduire E(R et Var(R en fonction de E(X, E(N, E(N, Var(N. b - Connaissant le nombre moyen (µ d accidents par semaine dans une usine, la variance (σ de ce nombre, la moyenne ν (et la variance τ du nombre d individus blessés dans un accident, estimez le nombre moyen et la variance du nombre d individus blessés en une semaine. Solution de l exercice 7. 6
a - On a en utilisant successivement les définitions, l indépendance de N, X,..., et le fait que les variables X i aient la même loi que X : [ N ] E(R E X k k n n n,(x,...,x n x i P[N n, X x,..., X n x n ] i P[N n] (x,...,x n x i P[X x,..., X n x n ] i P[N n]e[x +... + X n ] n P[N n]ne(x De même on obtient : k E(NE(X. [ ( N ] [ E(R N ] E X k E X k X l Ainsi : k,l n,(x,...,x n x i x j P[N n, X x,..., X n x n ] i,j P[N n] x i x j P[X x,..., X n x n ] n (x,...,x n i [ n ] P[N n]e X k X l n k,l ( P[N n] n(n E(X + ne(x n E(N(N E(X + E(NE(X. Var(R E(R E(R E(N E(X + E(NVar(X E(N E(X Var(NE(X + E(NVar(X b - On modélise le nombre d accidents par semaine par une variable aléatoire N, (X i i représente le nombre aléatoire d individus blessés dans l accident numéro i. On suppose que N, X,... sont indépendantes. Dans ce cas le nombre d individus blessés par semaine est : N i X i donc le nombre moyen d individus blessés par semaine est µν et sa variance σ ν + µτ. 7