Lois normales La loi de probabilité la plus utilisée en statistique est la loi normale, encore appelée loi de Gauss ou de Laplace_Gauss. C'est une distribution théorique qui ne se rencontre jamais exactement dans la nature mais de nombreuses distributions observées s'en rapprochent et sont représentées par une courbe en forme de «cloche» (c'est à dire avec beaucoup d'individus autour de la moyenne et de moins en moins au fur et à mesure que l'on s'éloigne de cette moyenne et ceci de façon symétrique ) I- Loi normale centrée réduite Définition : La fonction f définie sur R par f(x) = 1 2 e 2 est une densité de probabilité. C'est à dire qu'elle est continue positive sur R et l'aire sous la courbe vaut 1 u.a.. On a donc lim A A f x d x = 1 A Cette fonction f est paire ( f(x) = f( x) ) donc sa courbe représentative est symétrique par rapport à l'axe des ordonnées Définition : loi normale centrée réduite On dit qu'une variable aléatoire Z suit la loi normale centrée réduite si elle admet pour densité de probabilité la b 2 d x. fonction f : x 1 2 e La loi normale centrée réduite est notée N (0;1) 2. On a alors pour tous nombres réels a et b, P ( a Z b ) = a 1 2 e Propriétés 1) La fonction f étant paire sa courbe représentative est symétrique par rapport à l'axe des ordonnées. On en déduit que : P(Z [0;+ [ ) = 1 0 2 e 2 d x = 1 2 2) Pour tout réel u, P( Z u ) = 1 P( Z > u ) = 1 P( Z < u ). On a donc pour tout réel u, P( Z u ) = P ( Z u ) P( Z u ) = P ( Z u ) P( Z u ) = 1 P( Z < u ) 3) Si la variable aléatoire Z suit la loi normale N ( 0 ; 1 ) alors son espérance est nulle : E(Z) = 0 ( c'est pourquoi on l'appelle centrée ) son écart-type vaut 1 : Z =1 (c'est pourquoi on la dit réduite ) M. Philippe 26/04/13 Page 1 / 7
POINT CALCULATRICE Z est la variable aléatoire qui suit une loi normale N ( 0 ; 1 ). Pour calculer P ( a Z b ), on utilise la calculatrice : Casio On va dans le menu STAT puis DIST puis Norm On a alors trois possibilités : TI On obtient le menu des lois des probabilités par : 2 nd VAR (DIST) Seuls les numéros 1, 2 et 3 nous intéressent ici 1: Npd qui permet d'obtenir des valeurs prises par la fonction de densité Normal P, D x : 3 : 1 : 0 donne la valeur de f ( 3 ) 4,4 10 3 2 : Ncd qui permet de calculer P ( 4 Z 13 ) Normal C, D Lower : 4 Upper : 13 : 1 : 0 On trouve P ( 4 Z 13 ) 3,167 10 5 A noter que si l'on veut calculer P( Z 13 ), on place dans Lower une valeur très petite comme 1 10 99 La 3ème possibilité est vue plus loin 1 : normalpdf( qui permet d'obtenir des valeurs prises par la fonction de densité On tape : normalpdf( 3, 0, 1 ) donne f ( 3 ) 4,4 10 3 2 : normalcdf( qui permet de calculer P ( 4 Z 13 ) On tape : normalcdf( 4, 13, 0, 1 ) qui donne P ( 4 Z 13 ) 3,167 10 5 Syntaxe : normalcdf( a, b,, ) A noter que si l'on veut calculer P( Z 13 ), on place en première valeur une valeur très petite comme 1 10 99 Le numéro 3 sera vu plus loin Théorème : intervalle centré en 0 de probabilité donnée Si Z est une variable aléatoire qui suit une loi normale N ( 0 ; 1 ) alors pour tout nombre réel ]0;1[, il existe un unique nombre u > 0 tel que P( u Z u ) =1 Remarque : Il s'agit du problème inverse du problème précédent. On connait la probabilité et l'on cherche à calculer l'intervalle correspondant Démonstration ( exigible ) : On cherche un nombre x tel que P x Z x =1. La fonction densité de Z étant continue, on peut définir la fonction F par F(x) = f t d t = P ( Z x ) F est donc une primitive de f : F ' = f et comme f > 0, F est donc strictement croissante P x Z x =P Z x P Z x = P Z x P Z x = P Z x 1 P Z x = 2 P Z x 1 x On recherche donc x > 0 tel que 2 P Z x 1 = 1 P Z x =1 2 F(x) = 1 2 Dressons alors le tableau de variation de la fonction F. M. Philippe 26/04/13 Page 2 / 7
On a F(0) = 1 2 et lim F x =1 d'où F étant strictement croissante, on a le tableau de variation suivant : x Or ]0;1[ 1 2 ] 1 2 ; 1 [ x 0 + f '(x) + f(x) 1/2 On termine en utilisant le théorème de la bijection : F est continue et strictement croissante sur ]0;+ [ et on a : F ( ] 0 ; + [ ) = ] 1 2 ; 1 [ 1 Comme 1 2 ] 1 2 ; 1 [, d'après le théorème de la bijection, il existe un unique u ]0;+ [ tel que F(x) = 1 2 CQFD POINT CALCULATRICE Dans la pratique, le calcul de u se fait à l'aide de la calculatrice Casio On va dans le menu STAT puis DIST puis Norm Troisième possibilité : 3 : InvN qui permet de calculer a tel que P( Z a ) = p Inverse Normal Area : valeur de p : 1 : 0 TI On obtient le menu des lois des probabilités par : 2 nd VAR (DIST) numéro 3 3 : invnorm( qui permet de calculer a tel que On tape : P( Z a ) = p invnorm( p,, ) Si on veut P ( Z a ) = 3,167 10 5, on trouve a = 4 Si on veut P ( Z a ) = 3,167 10 5, on trouve a = 4 Deux valeurs à connaître A l'aide du point calculatrice précédent déterminer u dans les deux cas suivants : Pour = 0,05 une valeur approchée du nombre réel u 0,05 tel que P( u 0,05 Z u 0,05 )= 1 est : u 0,05 Pour = 0,01 une valeur approchée du nombre réel u 0,01 tel que P( u 0,01 Z u 0,01 )= 1 est : u 0,01 M. Philippe 26/04/13 Page 3 / 7
II- Lois normales N ( ; 2 ) Définition : Une variable X aléatoire suit la loi normale N ( ; 2 normale centrée réduite N ( 0 ; 1 ) ) si la variable aléatoire Z = X suit la loi Propriété : On a X = Z. Les deux paramètres et 2 de la loi normale N ( ; 2 ) s'interprètent comme l'espérance et la variance ( écart type au carré ) de X La démonstration est simple puisque X et Z sont reliées par une transformation affine donc d'après un résultat de première, on a : E(X) = E(Z) + or E(Z) = 0 donc E(X) = V(X) = 2 V(Z) or V(Z) = 1 donc V(X) = 2 Influence des paramètres et On admet que la loi normale N ( ; 2 ) est une loi à densité. Cette densité est la fonction g définie sur R par 1 g(x)= 1 2 e 2 X 2. Toutes les courbes ont la même forme celle d'une courbe en cloche mais l'axe de symétrie est alors la droite d'équation x =. L'écart type a quant à lui un impact sur la forme de la cloche : plus sigma est petit, plus la cloche est haute. Influence de =1,7 =5 Influence de Calculs de probabilités Soit X une variable aléatoire qui suit la loi normale N ( ; 2 ) Si on veut calculer P X, on revient à la loi centrée réduite Z associée à X : P X = P 1 X 1 = P ( 1 Z 1 ). Compléter alors sur le même principe : P 2 X 2 = P ( Z ) et P 3 X 3 = P ( Z ) Utiliser alors la calculatrice pour compléter la propriété suivante : M. Philippe 26/04/13 Page 4 / 7
Propriété : Soit X une variable aléatoire qui suit la loi normale N ( ; 2 ) P X P 2 X 2 P 3 X 3 III- Intervalle de fluctuation Situation : Dans une population de taille n, la proportion d'individus présentant un certain caractère est supposée être connu et égal à p. On prélève un échantillon de taille n ( échantillon assimilé à une suite de n tirages aléatoires avec remise ) et on étudie la fréquence du caractère dans cet échantillon III- 1 Définition Définition : X n est une variable aléatoire qui suit la loi binomiale de paramètre n et p. F n est la variable aléatoire définie par F n = X n. est un réel de l'intervalle ] 0 ; 1 [. n Un intervalle de fluctuation asymptotique de la variable aléatoire F n au seuil de 1 est un intervalle déterminé à partir de n et p et qui contient F n avec une probabilité d'autant plus proche de 1 que n est grand Théorème 1 : X n est une variable aléatoire qui suit la loi binomiale de paramètre n et p. F n est la variable aléatoire définie par F n = X n n Pour tout réel de l'intervalle ] 0 ; 1 [, il existe un unique réel u tel que lim P X n n n Démonstration: Voir p 432 Remarque : I n =1 où I n désigne l'intervalle [ p u p 1 p p 1 p ; p u n I n est alors appelé intervalle de fluctuation asymptotique de F n au seuil de 1 On admet que pour n 30, np 5 et n(1-p) 5, on peut utiliser l'approximation P( F n I n ) 1 p 1 p p 1 p Cas particulier : L'intervalle de fluctuation asymptotique au seuil de 95 % est p 1,96 ; p 1,96 [ n p 1 p p 1 p Cela signifie que F n appartient à l'intervalle p 1,96 ; p 1,96 [ n dans environ 95% des cas M. Philippe 26/04/13 Page 5 / 7
III-2 Intervalle de fluctuation en seconde et première S En classe de seconde, l'intervalle de fluctuation au seuil de 95 % que l'on a utilisé est J n =[ En classe de première S, l'intervalle de fluctuation au seuil de 95 % que l'on a utilisé est [ a n ; b n ] plus petit entier tel que P X n a 0,25 et b le plus petit entier tel que P X n b 0,975 p 1 n ; p 1 où a est le III-3 Prise de décision au seuil de 5 % La proportion du caractère étudié dans la population est supposée être p. La prise de décision consiste, à partir d'un échantillon de taille n, à valider ou non cette hypothèse faite sur la proportion p. Pour cela : on calcule la fréquence observée f du caractère dans cet échantillon si les conditions d'approximation n 30, np 5 et n 1 p 5 sont respectées, on détermine l'intervalle de fluctuation asymptotique I au seuil de 95 % de la variable aléatoire correspondant à la fréquence d'individus possédant le caractère étudié dans un échantillon de taille n. ( Sinon on utilise un intervalle de fluctuation vu en seconde ou 1S ) on applique alors la règle de décision suivante : si f I, on rejette l'hypothèse faite sur p avec un risque d'erreur d'environ 5 % si f I, on ne rejette pas l'hypothèse faite sur p sans connaître le risque d'erreur Application : D'après un encyclopédie, la proportion p de personnes de groupe sanguin A en France est 45%. Dans une classe de Terminale, 11 élèves sur 36 sont de groupe sanguin A a) Quelle est la fréquence de personnes de groupe sanguin A dans l 'échantillon? b) Déterminer l'intervalle de fluctuation au seuil de 95 % de F n. c) Peut-on accepter l'hypothèse faite sur la proportion p? IV Intervalle de confiance et estimation Situation : Dans une population de taille n, la proportion p d'individus présentant un certain caractère est supposée être inconnue. On prélève un échantillon de taille n ( échantillon assimilé à une suite de n tirages aléatoires avec remise ) et on étudie la fréquence du caractère dans cet échantillon dans le but d'estimer la proportion p à l'aide de cet échantillon. M. Philippe 26/04/13 Page 6 / 7
Définition : Un intervalle de confiance pour une proportion p à un niveau de confiance 1 ( ]0;1[ ) est la réalisation, à partir d'un échantillon, d'un intervalle aléatoire contenant la proportion p avec une probabilité supérieure ou égale à 1 Théorème : X n est une variable aléatoire qui suit une loi binomiale de paramètres n et p. F n est la variable aléatoire définie par F n = X n n Il existe un entier n 0 tel que, pour tout entier naturel n n 0, P p [ F n 1 n ; F n 1 0,95 Remarques : Cet intervalle de confiance est centré en f On utilise cet intervalle dès que n 30, nf 5 et n(1 f) 5. Le niveau de confiance à 95 % nous indique alors que dans 95 cas sur 100, la proportion p appartient à cet intervalle Application : Voici un extrait d'un article du journal Le monde après le premier tour de l'élection présidentielle de 2002 «Pour les rares scientifiques qui savent comment sont produites les estimations, il était clair que l'écart des intentions de vote entre les candidats LE PEN et JOSPIN rendait tout à fait plausible le scénario qui s'est réalisé. En effet, certains des derniers sondages indiquaient 18% pour JOSPIN et 14 % pour LE PEN» Sachant que les sondages sont effectués sur des échantillons de taille 1000, déterminer un intervalle de confiance au seuil 95% pour chacun des candidats puis confronter ces intervalles aux résultats de cette élection : 16,18 % pour JOSPIN et 16,86% pour LE PEN Propriété : Si l'on souhaite situer p dans un intervalle au niveau de confiance 95 %, d'amplitude donné a, la taille n de l'échantillon doit respecter n 4 a 2 Démonstration : M. Philippe 26/04/13 Page 7 / 7