) De B (n, p) à N (m, v) De la loi binomiale à la loi normale.a] Premier exemple : de B (6 ; ) à N (8 ; 4) Soit Y suivant la loi binomiale B(6 ; ) de paramètres n = 6 et p =. Espérance m = n p = 8, variance v = n p (- p) = 4 C est une variable discrète ayant 7 valeurs possibles, les entiers de à 6. On envisage deux types de graphique : en bâtons et avec des rectangles de largeur : 5 5,,,5,5 2 3 4 5 6 7 8 9 2 3 4 5 6 2 3 4 5 6 7 8 9 2 3 4 5 6 Représentation en bâtons. Les proba sont en ordonnée. ci-dessus l aire d un rectangle est égale à la proba les rectangles sont "centrés" sur les entiers (Cela revient à considérer une nouvelle variable aléatoire continue qui prolonge Y sur [- ; 6,5], et dont la densité est constante par intervalle.) Soit maintenant la variable X suivant la loi normale N (8 ; 4). espérance : m = 8, variance : v = 4, écart-type : = 2. C est une variable aléatoire continue à valeurs dans R de densité : f (x)= 2 2 π e 2 ( x8 2 ) 2 qui est tracée sur le schéma de gauche sur [ ; 6]. En dehors de [2 ; 4], les proba sont très faibles, et 2 rectangles sont dans cet intervalle qui est [m3 ;m+3]. 5 5,, 5E-2,5 2 4 6 8 2 4 6 2 3 4 5 6 7 8 9 2 3 4 5 6 À droite, on a "rassemblé" les 2 graphiques précédents : ils sont très proches et l aire sous la courbe est voisine de l aire des rectangles. Plus précisément et sur un exemple, on peut écrire : P(7 Y ) = somme des aires des 4 rectangles centrés en 7, 8, 9,, et on a l approximation : P(7 Y ) 6,5 f (x)dx, cette intégrale étant égale à P(6,5 X ) (et aussi à P(6,5< X <) ). Une approximation plus grossière est P(7 Y ) 7 f (x)dx=p (7 X ). Sa formule est plus simple, et il est intéressant de chercher à savoir quand cette approximation est pertinente. Michel Brissaud (88) (mi.brissaud@laposte.net) février 24 / 5
.B] Deuxième exemple : de B (48 ; 5) à N (2 ; 9) Y : Loi binomiale B (48 ; 5) de paramètres n = 48 et p = 5, espérance E(Y)= m = n p = 2, variance V(Y) = n p (-p) = 9. Y a 49 valeurs possibles, les entiers de à 48. Diagramme en bâtons avec des rectangles de largeur, l aire d un rectangle est égale à la proba. La distribution de proba de Y n est pas symétrique comme dans le cas précédent, cela vient du paramètre p qui est différent de. Mais il y a presque symétrie sur [ ; 25]. X : Loi normale (2 ; 9), espérance : m = 2, variance : v = 9, écart-type : = 3, densité : f (x)= 3 2π e 2 ( x2 3 ) 2. À gauche, on a tracé la courbe de la densité sur [ ; 48]. À droite, on a rassemblé les deux graphiques. En dehors de [3 ; 2], les proba sont très faibles, et 9 rectangles sont dans cet intervalle qui est [m3 ;m+3].,,8,6,4,2 4 8 2 6 2 24 28 32 36 4 44 48 La courbe est plus proche des rectangles que dans l exemple précédent, car il y en a plus (9) dans l intervalle [3 ; 2] qui "contient" presque toute la proba (il n y en avait que 2 précédemment). On a par exemple : P( Y 4) = somme des aires des 4 rectangles centrés en, 2, 3, 4, et comme en : 4,5 P( Y 4) f ( x)dx, mais ici les rectangles étant plus proches de la courbe que dans le cas précédent, on a une nouvelle approximation, un petit peu plus grossière, mais qui s exprime par une formule plus simple : 4 P( Y 4) f (x )dx, cette intégrale étant égale à P( X 4). Plus généralement, si Y suit la loi B (48 ; 5), alors P(a Y b) P (a X b) avec X suivant la loi N (E(Y) ; V(Y)) Ici, les approximations sont meilleures que dans le cas précédent car l écart-type est plus grand (les rectangles sont plus "fins" par rapport à l intervalle qui contient le "gros" de la proba), sans que la dissymétrie soit trop importante. Au paragraphe C], il y a des graphiques dans des cas où l approximation d une loi binomiale par une loi normale n est pas pertinente. Michel Brissaud (88) (mi.brissaud@laposte.net) février 24 2 / 5
.C] Mauvais exemples ) Avec Y suivant la loi B (48 ;,5) : Espérance E(Y) = n p = 2,4 Variance V(Y) = n p (- p) = 2,28 Écart-type : (Y),5 On remarque une forte dissymétrie qui s explique par une espérance np trop faible. De plus l écart-type est faible. On ne peut pas approcher avec une variable suivant une loi normale dont la courbe de densité est symétrique. 2) Avec Y suivant la loi B (48 ;,95) : Espérance E(Y) = n p = 45,6 Variance V(Y) = n p (- p) = 2,28 Écart-type : (Y),5 On remarque encore une forte dissymétrie qui s explique ici par une espérance np trop forte, et l écart-type est faible. Là encore, la variable aléatoire Y ne pourra pas être considérée comme proche de X suivant une loi normale. 3) Remarques : Ici, on a n(- p) = 2,4, et : np + n(- p) = n ; "np trop grand" correspond à "n(- p) trop petit" Si on compare les 2 cas précédents, le diagramme de l un est symétrique de l autre et cela peut se justifier facilement en revenant à la formule de calcul des proba pour une loi binomiale car le paramètre p est,5 en A] et,95 en B] (somme ). Des graphiques semblables montrent que np et n(- p) doivent être plus grands que 5 pour éviter les dissymétries observées ci-dessus. L écart-type est assez grand si n est grand (quelques dizaines). 2) De N (m, v) à N (, ) Exemple : de N (8, 4) à N (, ) ) ci-dessous à droite la densité de la loi normale (8, 4) : f ( x)= 2 2π e 2 ( x 8 2 ) 2, à gauche, la densité de la loi normale ( ; 4) : f (x)= 2 2π e 2 ( x 2 ) 2, -8-6 -4-2 2 4 6 8 2 4 On a f (x)= f (x+8) et on passe de la courbe de f à celle de f par une translation, les aires ne sont donc pas changées, et f est la densité de proba de la variable aléatoire X = X - 8 Michel Brissaud (88) (mi.brissaud@laposte.net) février 24 3 / 5
2) en trait continu, la courbe de la fonction f (x)= 2 2π e en pointillé, la courbe de f 2 (x)= 2 2 π e 2 x2 2 ( x 2 ) 2 On a f 2 (x)= f (2 x) et on passe de la courbe de f à celle de f 2 par la transformation géométrique suivante : à ordonnée constante, on divise les abscisses par 2. Les aires sont divisées par 2. Remarque : la fonction f 2 n est pas une densité de probabilité. 3) en pointillés serrés, la courbe de f 2 (x)= 2 2 π e en pointillés espacés, la courbe de f (x)= 2π e 2 x 2 2 x2 On a f (x)=2 f 2 ( x) et on passe de la courbe de f 2 à celle de f par la transformation géométrique suivante : à abscisse constante, on multiplie les ordonnées par 2. Les aires sont multipliées par 2., f est la densité de probabilité d une variable aléatoire X suivant la loi N (, ). -8-6 -4-2 2 4 6 8 4) Au final, on obtient : à gauche, densité f de X suivant la loi N ( ; ), à droite, densité f de X suivant la loi N (8, 4)., -4-2 2 4 6 8 2 4 Et surtout, par la composée des transformations géométriques utilisées, les aires sont conservées! Michel Brissaud (88) (mi.brissaud@laposte.net) février 24 4 / 5
En dessous à droite, les aires des zones grisées sont égales, en utilisant les transformations géométriques précédentes. Sous la courbe de f c est 7 f ( x)dx=p(7 X ) Sous la courbe de f,5 c est f (x)dx=p ( X,5) On a alors : P(7 X )=P( X,5) et plus généralement : P(a X b)=p( a8 2 X b8 2 ) et plus généralement encore un raisonnement semblable permettrait de justifier :, si X suit la loi N ( m ; 2 ) et X suit la loi N ( ; ), P(a X b)=p( am X bm ) Cette variable aléatoire X est alors la variable X m. On ainsi justifié que si X suit la loi N ( m ; 2 ), alors la variable -4-2 2 4 6 8 2 4 X m suit la loi N ( ; ). 3) Conclusion : de B (n, p) à N (, ) Si Y suit la loi B (n ; p) avec n "assez grand" (quelques dizaines au moins), np et n(- p) plus grands que 5, et en notant m l espérance et l écart-type de Y, on a l approximation : P(a Y b) P (a X b) avec X suivant la loi N ( m ; 2 ) avec de plus P(a X b)=p( am X m bm ) avec X m = X qui suit la loi N ( ; ). Michel Brissaud (88) (mi.brissaud@laposte.net) février 24 5 / 5