CONCOURS COMMUN H.E.C. E.S.C.P. E.S.C.L MATHÉMATIQUES II

CONCOURS COMMUN H.E.C. E.S.C.P. E.S.C.L. 1995 MATHÉMATIQUES II OPTIONS: ÉCONOMIQUE ET TECHNOLOGIQUE Ce problème est consacré à l étude de la loi de Pareto ViIfredo Pareto 1848-1923. La première partie étudie les propriétés de cette loi. On montre ensuite, sur un eemple, comment elle permet de modéliser de façon très satisfaisante des pénomènes rencontrés en démograpie. Les revenus d une population sont aussi très bien modélisés par une loi de Pareto, et on compare deu modes de calcul d impôts sur des revenus suivant une loi de Pareto. La seconde partie est l étude de l indice d inégalité de Gini dans le cas d une loi de Pareto. Toutes les variables aléatoires considérées dans ce problème sont à valeurs réelles. PARTIE I. La loi de Pareto. Dans tout le problème et désignent deu nombres réels strictement positifs. On dit qu une variable aléatoire réelle X suit une loi de Pareto de paramètres et si X, à valeurs dans, +, admet pour densité la fonction f définie par : { f = < On écrit alors que X suit V P,. f = +1 A. Quelques résultats probabilistes. 1. Soit X une variable aléatoire suivant V P,. a f est continue par morceau sur R +1 pour > et positive. f est impropre en ±. f = converge et vaut. d = +1 f = + f converge et vaut 1. Donc b On a F = ] M = = M + f = 1 et f est bien une densité de probabilités. f donc pour < on a F = = et pour : F = + f = 1 Pour, ln 1 F = ln 2. Soit X une variable aléatoire suivant V P,. = 1 1 quand M + car > donc = ln ln car et > a X admet une espérance si f d converge impropre en ± f d = =

f d = d intégrale de Rieman qui converge si et seulement si > 1 Et pour > 1 : f d = ] M = 1 1 = 1 M 1 1 quand M + car > 1 donc X a une espérance si et seulement si > 1,et E X = 1 b X admet une variance si et seulement si elle a une espérance > 1 et si X 2 en a une : si + 2 f d converge. 2 f d = = 2 f d = d intégrale de Rieman qui converge si et seulement si 1 > 1 1 Et pour > 2 : 2 f d = ] M = 2 2 = 2 M 2 2 2 2 quand M + car > Donc X 2 a une espérance si et seulement si > 2 et E X 2 = 2 2 D où, X a une variance ssi > 2 et V X = 2 2 2 2 = 2 2 + 1 2 + 2 1 2 1 2 = 2 2 1 2 3. Soient une variable aléatoire X suivant V P, La fonction de répartition G de Y = λ X est définie par G = p Y = p λ X = p X /λ car λ > = F /λ avec F la fonction de répartition de X. Donc pour /λ < i.e. λ on a G = et pour λ : G = 1 /λ = 1 λ et on reconnait là, la fonction de répartition de V P, λ avec >. Conclusion : Y suit la loi V P, λ. Donc Y suit cette loi. 4. Soit une variable aléatoire W qui suit une loi eponentielle de paramètre β >. Soient k un nombre réel strictement supérieur à 1 et un nombre réel strictement positif. La fonciton de répartition de T = k W est G définie par G = p T = p k W On résout : Donc k W = k W / car > si alors G = = W ln k ln / si > car / du signe de = W ln / car ln k > car k > 1 donc ln k

si < alors ln / < et G = p W ln / ln k de répartition de W ln / = F ln k avec F la fonction On a alors le coi de cercer la fonction de répartition de la loi eponentielle ou de revenir au téorème caractérisant les fonctions de répartitions de variables à densité : Comme W est à densité, F est continue sur R et tend vers en -. Donc G est continue sur ], ] et sur ], + En + : quand on a ln / et donc F en + donc sur R. ln/ = G donc G est continue lnk Comme F est C 1 sur R alors G est C 1 sur R \ { } le point pour lequel ln / = Donc T est à densité de densité g = G = sur ], et ln g = F / 1 1 ln ln k ln k = f / 1 1 ln k ln k pour > et Pour < < on a ln / < et donc g = Pour > : g = β e β ln/ 1 1 ln k ln k = β β/ ln k 1 1 ln k = β β/ ln k ln k β/ ln k+1 β Finalement on reconnait la densité de V P, lnk la fonction de répartition d une variable à densité β Conclusion : T suit la loi P, lnk. 5. Soit une variable aléatoire X suivant V P,. La probabilité que X soit définie est de 1 car la densité de X est nulle sur R Soit G la fonction de répartition de X, et F celle de X. X G = p donc si < on a G = si 2 < i.e. < si on a G = p X 2 = F 2 = 2 1 = 1 si 2 2 et on reconnait que la fonction de répartition de X est celle de V P 2, Conclusion : Donc la loi de X est V P 2, B. Propriété caractéristique de la loi de Pareto. Soient une variable aléatoire X de densité f, admettant une espérance, et un nombre réel tel que + f t dt. t f t dt On appelle moyenne de X sur, + le nombre réel M égal à f t dt.

1. M t f t dt non nul et positif On doit donc comparer deu intégerales f t dt = contenus : f t dt car le dénominateur est strictement positif. puisque f t dt et donc on compare leurs Pour t on a t f t f t car f t donc en intégrant pour N, N t f t dt N f t dt f t dt converge car f est une densité et t f t dt car X a une densité. Donc par passage à la limite dans les inégalités quand N +, t f t dt f t dt = f t dt d où t f t dt f t dt et Conclusion : M pour tout réel 2. Dans cette question on suppose que la variable X suit V P, avec > 1. Pour tout R on a f t dt = 1 F t. avec F la fonction de répartition de X Pour, F = 1 et et M = 1 1 = N f t dt = N t f t dt = t dt = 1 = 1 N 1 1 1 = t f t dt 1 1 ] N t 1 t= 3. Réciproquement soient un nombre réel strictement positif et une variable aléatoire X à valeurs dans, +, i.e. p X < = de densité f donc f = sur ], continue donc sa fonction de répartition est C 1 et à valeurs strictement positives sur, + donc, f t dt admettant une espérance et telle qu il eiste un réel k > 1 tel que : M = k On se propose d établir que X suit une loi de Pareto à deu paramètres. On pose, pour, G = f t dt, et H = t f t dt on remarque que M = H G a G = f t dt = f t dt f t dt et comme f est continue sur, + alors g est dérivable sur R et G = f De même H est dérivable sur, + et H = f b pour,comme M = k alors H = k G donc H = k G + G et f = k G + G avec G = f donc G = k G + G et 1 k G = kg Conclusion : G = 1 k k G pour tout, +

c Pour, on pose I = k G. I est dérivable sur, + et I = G dans laquelle on fait réap- = paraître la relation précédente I = k 1 k k 1 G + k k k 1 G 1 k k G Donc I est constante sur, + et vaut donc sa valeur en : G avec G = + f t dt = 1 f t dt = 1 Donc G = k et p X = 1 G = 1 k k d Donc la fonction de répartition de X est celle de V P k, sur, + est nulle sur ], par ypotèse. Conclusion : La loi de X est V P k, C. Un eemple statistique : la démograpie. Des statistiques sur la démograpie du département des Ardennes en 1962 indiquent la répartition de la population des 45 communes de ce département. On note : : Nombre d abitants, N : Nombre de communes possédant plus de abitants, et on dispose du tableau suivant : N 18 2 13 3 7 5 38 1 25 15 18 2 14 25 11 3 85 35 6 4 Ces données sont représentées dans le grapique figurant sur la page 5 sur papier ln ln de l énoncé, grapique qui n est pas à reproduire sur la copie. Le grapique représente les points d abscisse In et d ordonnée In N pour les valeurs du tableau. Une étude statistique permet d estimer que ce nuage de points peut être modélisé par une droite D figurant sur le grapique 1. Lire, sur le grapique, le coeffi cient directeur de D. 2. Epliquer pourquoi on peut modéliser la distribution de la taille des communes par une loi de Pareto à deu paramètres V P, 3. Donner, d après le grapique, une valeur approcée de a. k k

D.Comparaison de deu modes d imposition sur le revenu. Soient X une variable aléatoire de densité f, g une fonction continue sur R et Y la variable aléatoire définie par Y = g X. On admet que si l intégrale g f d est absolument convergente, alors Y admet une espérance E Y donnée par la valeur de cette intégrale. Dans cette partie, X représente la valeur du revenu d un individu d une population donnée. On suppose que X est une variable aléatoire qui suit V P, avec > 1. Y représente la valeur de l impôt correspondant, fonction du revenu X. On désire que l impôt ne touce que les revenus supérieurs ou égau à, réel donné tel que. 1. Calcul d un impôt proportionnel. 2. Soient p un nombre réelstrictement compris entre et 1 et g 1 la fonction définie sur R par { g 1 = < g 1 = p On pose Y 1 = g 1 X. g 1 est continue sur ], et sur, +. En on a : g = = g quand donc g 1 est continue sur R. Donc d après la propriété donnée par l énnoncé, si g 1 f d converge absolument alors Y 1 a une espérance : Et comme g 1 et f sur R, la convergence équivaut à l absolue convergence. g 1 f d est impropre en ± et g 1 f d = d = g 1 f d = p dcar +1 p 1 d = p +1 d = p +1 1 1 1 + 1 1 = p 1 1 1 M + 1 1 M + 1 1 1 1 ] 1 1 1 1 p 1 1 1 ] 1 p = 1 1 1 1 Donc l intégrale est g 1 f d = g 1 f d est absolument convergente et Y 1 a une espérance. Conclusion : E Y 1 = 3. Calcul d un impôt progressif. p 1 1 On dit que l impôt est progressif si le quotient de l impôt par le revenu est une fonction croissante du revenu. Soit m ], 1 et, q un réel strictement positif. ] M

On définit la fonction g 2 sur R par g 2 = < q g 2 = m On pose Y 2 = g 2 X a Pour savoir si l impôt est progressif, il faut étudier les variation de p = g 2 / pour > g 2 est continue sur R + en car g 2 = car q > donc p également. p est constante sur ], ] q q 1 sur ], + et p = m et p est dérivable et p = m q = 2 q 1 m q > 2 Donc le quotient de l impôt par le revenu est une fonction croissante du revenu et Conclusion : l impôt est bien progressif q Quand +, on a 1 donc g 2 m. et Conclusion : m est le tau d imposition asymptotique quand le revenu tend vers + b Montrer que g 2 est continue et que Y 2 admet une espérance. À l aide du cangement de variable u =, prouver que : E Y 2 = m 1 1 u q 1 u 2 du c En intégrant par parties, calculer E Y 2 pour q N. 4. On suppose encore dans cette question que q est un entier strictement positif. Déterminer le quotient p m, en fonction de et q, de sorte que E Y 1 = E Y 2 PARTIE II. Courbe de concentration et inégalité des revenus. La Courbe de concentration est une courbe statistique introduite par Lorentz et développée par Gini pour rendre compte de l inégalité de la distribution des revenus. On désigne par F la proportion des individus d une population donnée ayant un revenu inférieur ou égal à et par Q le quotient de la masse des revenus de ces mêmes individus par la masse totale des revenus de la population. On appelle courbe de concentration la représentation grapique de la fonction C donnant Q en fonction de F. Dans toute la suite, X est une variable aléatoire qui représente le revenu d un individu de cette population. On suppose que X suit V P, avec > 1. On note F la fonction de répartition de X, E X son espérance et on pose Q = 1 t f t dt E X pour. On appelle indice d inégalité de Gini de la variable X le réel I qui est égal à deu fois l aire située entre la courbe de concentration de X et la première bissectrice.

C est à dire : I = 2 1 t C t dt. On estime que plus I est grand, plus l inégalité des revenus est grande. 1. a Calculer Q pour. b On pose C t = 1 1 t 1 pour t, 1 et C 1 = 1 Vérifier que C F = Q pour. Ainsi la courbe représentative de C est la courbe de concentration de X. c Étudier les variations de C et tracer son grape dans un repère ortonormé en précisant les tangentes au deu etrémités. d Prouver que : C t t t, 1]. Cette inégalité n était-elle pas prévisible sans calcul? e Déterminer si on sait que 3% des individus ayant les plus auts revenus se partagent 6% de la masse des revenus. Dans la suite n est plus supposé égal à cette valeur. 1 f Montrer que I = 2 1. 2. On prélève sur tous les revenus un impôt proportionnel au revenu c est à dire que, si Y désigne le revenu disponible après imposition, Y = 1 λ X avec λ ], 1. a Calculer I Y. On pourra utiliser les résultats de I.A.3. b Quel est l effet de cette imposition sur l inégalité des revenus? 3. On prélève sur tous les revenus un impôt progressif tel que, si T désigne le revenu disponible après imposition, on ait T = X désignant un réel positif. a À l aide de la partie I, déterminer la loi de T et calculer I T. b Quel est l effet de cette imposition sur l inégalité des revenus?