La loi log-normale
La loi log-normale Définition On a pu voir que les valeurs possibles d une variable aléatoire normale étaient l ensemble des nombres réels. Pour une situation réelle ne pouvant prendre des valeurs négatives on peut malgré tout utiliser une loi normale lorsque la moyenne et l écart type sont tels que la probabilité théorique d avoir une valeur négative est à toute fin pratique nulle. Exemple : Prenons une loi normale de moyenne µ = 30 et d écart type σ = 10. P ( 0) P µ 0 30 < = < = PZ ( < 3) = 00013 σ 10 Par contre pour une situation réelle ayant une moyenne très faible (ce qui est souvent le cas d analyses en météorologie ou d analyses sur la concentration de produits chimiques) il est très difficile d oublier ce fait. De plus les situations ne pouvant prendre des valeurs négatives et ayant une moyenne très faible ont tendance à présenter une distribution dissymétrique donnant ainsi une proportion d événements extrêmes plus grande que celle prévue par la loi normale. Voici une courbe typique d une telle situation : Puisque nous avons affaire à une situation ne prenant pas de valeurs négatives il est possible de calculer le logarithme de ces valeurs dans une base quelconque et ces nouvelles valeurs se distribuent sur tous les réels les valeurs comprises entre 0 et 1 ayant des valeurs logarithmiques négatives et les valeurs supérieures à 1 ayant des valeurs logarithmiques positives. Ce raisonnement est à la base de la loi log-normale.
Une distribution de probabilité d une variable aléatoire est dite log-normale si la distribution de probabilité de la variable aléatoire = ln est normale. Les caractéristiques de la loi log-normale Tout comme la loi normale une distribution log-normale est complètement définie par deux paramètres. Si on note la variable aléatoire qui suit une loi log-normale et = ln la variable aléatoire qui suit une loi normale les deux paramètres qui caractériseront la variable aléatoire log-normale seront habituellement µ la moyenne de la variable aléatoire normale et σ la variance de la variable aléatoire normale (ou σ l écart type de la variable aléatoire normale). Par contre dans certaines applications on préfère utiliser comme paramètres connus GM la moyenne géométrique de la variable aléatoire et GSD l écart type géométrique de la variable aléatoire. Voici quatre courbes log-normales. Elles diffèrent énormément mais pourtant elles ont une caractéristique commune : la moyenne arithmétique de ces variables aléatoires log-normales est 10.
On peut noter à partir des ces quatre courbes que la moyenne arithmétique de 10 semble plus appropriée comme évaluation du centre de la courbe pour la courbe qui est la plus symétrique. Les principales caractéristiques de ces quatre courbes sont : variable aléatoire log-normale et = ln variable aléatoire normale ME GM GSD µ µ σ = σ MO = µ σ = 18 57 100 146 9 17 11 49 79 100 79 0 1 07 78 9 100 4 15 04 95 98 100 18 1 3 0 Si on connaît la moyenne géométrique et l écart type géométrique de la variable aléatoire qui est log-normale il est possible de calculer les caractéristiques moyenne et variance (ou écart type) de la variable aléatoire = ln qui est normale en utilisant les propriétés suivantes : Soit la variable aléatoire log-normale ayant moyenne géométrique GM connue écart type géométrique GSD connu. Si = ln est la variable aléatoire normale ayant moyenne µ = µ variance σ = σ alors écart type σ = σ µ = µ = lngm σ = σ = ln GSD. Si on connaît les caractéristiques moyenne et variance (ou écart type) de la variable aléatoire = ln qui est normale il est possible d établir un lien entre ces caractéristiques connus et les caractéristiques correspondantes de la loi lognormale. Soit la variable aléatoire log-normale ayant moyenne µ variance σ écart type σ moyenne géométrique GM écart type géométrique GSD.
Si = ln est la variable aléatoire normale ayant moyenne µ = µ connue variance σ = σ connue écart type σ = σ connu alors µ + σ µ = e ( µ + σ) σ σ = e (1 e ) ( µ + σ) σ 1 σ = e e GM = e µ GSD = e σ. Les autres caractéristiques de la loi log-normale peuvent aussi être évaluées de la connaissance des paramètres µ et σ (ou σ) de la loi normale correspondante. Soit la variable aléatoire log-normale Si = ln est une variable aléatoire normale ayant moyenne µ = µ connue variance σ = σ connue écart type σ = σ connu alors la fonction de densité de la variable aléatoire est 0 si x 0 f ( x) = (ln x µ ) 1 e σ si x>0 σx π la médiane de la variable aléatoire est ME = e µ ; 06745 le premier quartile de la variable aléatoire est Q = e µ σ ; 06745 le troisième quartile de la variable aléatoire est Q = e µ + σ ; le mode de la variable aléatoire est On peut constater puisque MO = e µ σ ME = e µ et que GM = e µ on a donc ME = GM c est-à-dire que la médiane et la moyenne géométrique sont égales. 1 3
De plus puisque MO = e µ σ ME = e µ et µ µ + e σ = on a donc MO < ME < µ c est-à-dire que la médiane est toujours comprise entre le mode et la moyenne. Exemple : Soit une variable aléatoire log-normale ayant une moyenne géométrique de 98 et un écart type géométrique de 1. Déterminer la moyenne et l écart type de la variable aléatoire = ln correspondante. Déterminer la moyenne arithmétique la médiane le mode l écart type de la variable aléatoire.
Il est possible algébriquement d inverser les calculs. Soit une variable aléatoire normale ayant moyenne µ = µ variance σ = σ écart type σ = σ Si = e est une variable aléatoire log-normale ayant moyenne µ connue variance σ connue écart type σ connu moyenne géométrique GM écart type géométrique GSD alors 1 µ = lnµ ln( µ + σ ) σ = ln( µ + σ ) ln µ σ = µ + σ µ ln( ) ln GM = e µ GSD = e σ. Exemple : Soit une variable aléatoire log-normale de moyenne arithmétique 10 et d écart type 1.8. Calculer la moyenne et l écart type de la variable aléatoire = ln correspondante. Calculer la moyenne géométrique et l écart type géométrique de la variable aléatoire.
Calcul de probabilités pour une loi log-normale Pour évaluer des probabilités sur une loi log-normale il est possible d utiliser la loi normale qui lui correspond. Soit une variable aléatoire log-normale. Pour calculer P( a b) on utilise le fait que la variable aléatoire = ln est normale et que P( a b) = P(lna ln ln b) = P(lna ln b) Si la moyenne géométrique GM et l écart type géométrique GSD de la variable aléatoire log-normale sont connus alors et µ = µ = lngm σ = σ = ln GSD lna µ µ lnb µ lna µ ln b µ P( a b) = P(lna ln b) = P = P Z σ σ σ σ σ
Exemple : Si = «les concentrations d un contaminant auxquelles est exposé un employé dans une journée de travail de 8 heures» est une variable aléatoire qui suit une loi log-normale de paramètre GM = 55 ppm et GSD = 30 ppm calculer P(5 85)
Ajustement graphique d une loi log-normale On peut utiliser le fait que si est une variable aléatoire log-normale alors la variable aléatoire = ln est une variable aléatoire normale. Si nous prenons un échantillon de taille n = { x1 x xn} provenant d une population qui suit une loi log-normale l ensemble = { ln x1ln x ln x n } proviendrait d une population qui suit une loi normale. L ajustement de l ensemble de données avec une droite de Henry sur papier gaussoarithmétique permettra de décider de la pertinence ou non de l ajustement de la variable à une loi log-normale. Exercices 1. Soit une variable aléatoire log-normale ayant une moyenne géométrique et un écart type géométrique connus. a) Déterminer la moyenne et l écart type de la variable aléatoire = ln correspondante. b) Déterminer la moyenne arithmétique la médiane le mode l écart type de la variable aléatoire. i) GM = 57 et GSD = 9. ii) GM = 79 et GM = 9 et GSD = 1. GSD = 15. iii). Soit une variable aléatoire log-normale de moyenne arithmétique et d écart type connus. a) Calculer la moyenne géométrique et l écart type géométrique de la variable aléatoire. b) Calculer la moyenne et l écart type de la variable aléatoire = ln correspondante. i) µ = et σ = 09. ii) µ = 161 et σ = 6. iii) µ = 163et σ = 69. 3. Soit une variable aléatoire log-normale de paramètres GM = 57 et GSD = 9. Calculer les probabilités suivantes : a) P(0 10) b) P( 15) c) P(0 57) d) P(5 15)
4. Déterminer si les données du no. 4 des exercices sur «La droite de Henry» suivent une loi log-normale en utilisant la droite de Henry et si l ajustement semble satisfaisant calculer une approximation de la moyenne et de l écart type de ces données à partir de la droite de Henry. Réponses aux exercices 1. variable aléatoire log-normale et = ln variable aléatoire normale MO ME = GM µ σ GSD µ = µ σ = σ 18 57 100 146 9 17 11 49 79 100 79 0 1 07 78 9 100 4 15 04. xxx variable aléatoire log-normale et = ln variable aléatoire normale ME GM GSD µ µ σ = σ MO = µ σ = 17 0 09 15 07 04 4 85 161 60 31 1 11 17 150 163 69 15 7 04 3. a) 0701 b) 01817 c) 05 d) 0367 4. L ajustement semble raisonnable µ -07 et σ 105. µ 086 et σ 1.