DM 16 : propriétés des fonctions convexes : avec solution

DM 16 : propriétés des fonctions convexes : avec solution Quelques questions légèrement modifiées pour un exposé plus commode de la solution, qui s apparente ainsi à un cours réutilisable en deuxième année. Soit I un intervalle de R. On rappelle qu une fonction f I R est convexe sur I si, et seulement si, pour tout (x, y) I 2, pour tout t [0, 1], f((1 t)x + ty) (1 t)f(x) + tf(y). Conseil : faire beaucoup de dessins! Pour chaque x 0 I. On note p x0 I {x 0 } R, x f(x) f(x 0), appelée fonction pente à partir de x 0. a) Caractérisation des fonctions convexes par la croissance des pentes : Démontrer que trois propriétés suivantes sont équivalentes : (i) f est convexe sur I, (ii) pour tout x 0 I, p x0 est croissante sur I {x 0 }. (iii) pour tout x < y < z dans I, en notant X = (x, f(x)), Y = (y, f(y)), Z = (z, f(z)), la pente du segment [X, Y ] est inférieure à celle du segment [Y, Z]. On illustrera ceci sur un ou plusieurs dessins. b) Précision sur la stricte convexité Définition : Une fonction f I R est strictement convexe ssi pour tout (x, y) I 2 avec x y et tout t ]0, 1[, on a, f((1 t)x + ty) < (1 t)f(x) + tf(y). Question : Que dire d une fonction convexe non strictement convexe? c) Une inégalité simple qui entraîne la propriété de Lipschitz : (i) Montrer que si f I R est convexe alors pour tout a < b dans I, on a x [a, b], f(x) max(f(a), f(b)). (ii) En déduire qu une fonction convexe sur I est lipschitzienne sur tout segment [a, b] I et donc qu une fonction convexe sur I est en particulier continue sur I. (iii) Donner un exemple de fonction convexe sur un intervalle I discontinue au bord de I. d) Existence et propriétés des dérivées à gauches et à droites Soit I un intervalle et f I R une fonction convexe. (i) Montrer que f admet une dérivée à gauche et à droite en tout point de I et que pour tout x < y dans I, on a les inégalités : Illustrer ceci sur un dessin f g(x) (1) f d(x) (2) f(y) f(x) (3) f y x g(y) (4) f d(y). (ii) Justifier qu une fonction qui admet une dérivée à gauche et à droite en un point x 0 est continue en x 0 : ainsi la propriété précédente redonne un preuve du fait qu une fonction convexe sur I est continue en tout point de I. (iii) Si f est strictement convexe, justifier qu on a en plus (avec les mêmes notations que ci-dessus) : f d(x) f(y) f(x) < < f y x g(y). e) Caractérisations de la convexité dans le cas dérivable On suppose dans cette question que I est un intervalle et que f D(I, R). 1

(i) Montrer que f est (strictement) convexe sur I si, et seulement si, f est (strictement) croissante sur I. (ii) Montrer que f est convexe sur I si, et seulement si, Γ f est au-dessus de sa tangente en tout point, ce qui signifie que : x 0 I, x I, f(x) f(x 0 ) + ( )f (x 0 ). Rem. Dans le cas où f est strictement convexe, Γ f est strictement au-dessus de sa tangente en dehors du point de contact. f) Propriété des extrema d une fonction convexe (i) Maxima : Soit f I R une fonction convexe quelconque sur un intervalle I. On a vu à la question c) (i), que sur tout segment [a, b], f atteint son maximum en un point du bord de I. Montrer, mieux, que s il existe c point intérieur à I où f atteint son maximum sur I alors f est constante sur I. (ii) Minima : Soit f convexe sur un intervalle I. (1) Montrer que si f admet un mimimum local, c est un min. global. (2) Montrer que si f admet un minimum local en deux points x 0 < x 1 alors f est constante sur le segment [x 0, x 1 ] (3) Montrer que si on suppose f convexe dérivable sur I ouvert et que x 0 I vérifie f (x 0 ) = 0 alors x 0 réalise un min. global de f. g) Propriétés plus difficiles! (i) Pseudo-dérivée seconde : Soit I un intervalle ouvert et x 0 I. Soit f I R. On dit que f admet une pseudo-dérivée seconde en x 0 ssi f(x 0 + h) + f(x 0 h) 2f(x 0 ) admet une limite finie quand h 0. Cette limite sera alors notée f 2 (x 0 ). Montrer que si f est continue et admet une pseudo dérivée seconde f 2 vérifiant f 2 0 sur I entier, alors f est convexe sur I. Qu en déduire si f 2 = 0 sur I? (ii) Lien D.L 2 / D 2 pour les fonctions convexes : Soit f une fonction convexe sur un intervalle I et soit x 0 I. On suppose que f admet un DL 2 en x 0. Montrer que f est de classe D 2 en x 0. Question probablement vraiment difficile sans indication.. vous pourrez avoir des indications.. h 2 2

Ce qu il manque à ce corrigé : tous les dessins que vous devez faire en le lisant! a) Caractérisation des fonctions convexes par la croissance des pentes : Sens (i) (ii) : on a f convexe sur I. Soit x 0 I et x x 0, y x 0 dans I avec x < y. On veut montrer que p x0 (x) p x0 (y). N.B. Pour la preuve, il est nécessaire de distinguer les cas x < y < x 0 ou x < x 0 < y ou x 0 < x < y. En fait f est convexe sur I ssi x f( x) est convexe sur J = I, ce qui permet de ramener le 3ème cas au premier. On va voir aussi que le deuxième se ramène au premier. On veut montrer que f(x) f(x 0) f(y) f(x 0) (C). y x 0 1er cas : x < y < x 0. Avec l hypothèse de ce cas, en multipliant par ( ) < 0 et (y x 0 ) < 0, on obtient (C) (f(x) f(x 0 ))(y x 0 ) (f(y) f(x 0 ))( ) On écrit y = (1 t)x + tx 0 avec t ]0, 1[. Avec ces notations : y x 0 = (1 t)( ) donc (C) (f(x) f(x 0 ))(1 t)( ) (f(y) f(x 0 ))( ). Donc en simplifiant par ( ) < 0, (C) (f(x) f(x 0 ))(1 t) f(y) f(x 0 ). Finalement (C) f(y) (1 t)f(x) + tf(x 0 ) ce qui est bien donné par la convexité de f puisque y = (1 t)x + tx 0. Donc (C) est vraie. 3ème cas : Si x < y < x 0, on considère g x f( x) qui est convexe sur I et on lui applique le 1er cas. 2ème cas : Si x < x 0 < y. On peut remarquer que par le premier cas p x (x 0 ) p x (y). Mais p x (x 0 ) = p x0 (x) et p x (y) = p y (x) Donc on a p x0 (x) p y (x) (1). Enfin par le 3ème cas, p y (x) p y (x 0 ) (2). Avec les inégalités (1) et (2) on obtient p x0 (x) p y (x 0 ) = p x0 (y). (Cela se voit beaucoup mieux avec un dessin). Sens (ii) (iii) : le (iii) est un cas particulier de la croissance de la fonction p y avec x < y < z. Sens (iii) (i) : Soit x < z. Soit y = (1 t)x + tz avec t [0, 1]. On veut montrer que f((1 t)x + tz) (1 t)f(x) + tf(z). f(y) f(x) f(z) f(y) Or par (iii), on sait que ( ). y x z y Or y x = t(z x) et z y = (1 t)(z x) donc en simplifiant par (z x) > 0, et en multipliant par t et 1 t positifs, on déduit de ( ) : (1 t)(f(y) f(x)) t(f(z) f(y)) donc f(y) tf(z)+(1 t)f(x), ce qu il fallait démontrer. b) Que dire d une fonction convexe non strictement convexe? Réponse : soit f une fonction convexe. On va montrer que : f n est pas strictement convexe si, et seulement s il existe un sous-intervalle [a, b] I avec a < b tel que f [a,b] est affine. Sens facile : si f est affine sur un intervalle [a, b] avec a < b alors pour tout t [0, 1], f((1 t)a + tb) = (1 t)f(a) + tf(b) ce qui pour t ]0, 1[ montre que f n est pas strictement convexe. Sens moins facile : on suppose que f n est pas strictement convexe (mais convexe). Donc il existe a < b dans I et il existe t 0 ]0, 1[ tel que l inégalité stricte f((1 t 0 )a + t 0 b) < (1 t 0 )f(a)+t 0 f(b) soit fausse. Or comme l inégalité large est vraie par convexité de f, cela signifie que f((1 t 0 )a + t 0 b) = (1 t 0 )f(a) + t 0 f(b) ( ). Notons x 0 = (1 t 0 )a + t 0 b. Géométriquement, l égalité ( ) signifie que le point (x 0, f(x 0 )) est sur le segment [A, B] où A = (a, f(a)) et B = (b, f(b)). Alors ( ) signifie que p x0 (a) = p x0 (b). Mais comme p x0 est croissante, on en déduit que p x0 est constante sur tout [a, b] {x 0 }, ce qui signifie encore que f est affine sur [a, b]. 3

c) Une inégalité simple qui entraîne la propriété de Lipschitz : (i) Soit a < b dans I soit x [a, b] qu on note x = (1 t)a + tb avec t [0, 1]. Alors comme f est convexe, en notant M = max(f(a), f(b)), f(x) (1 t)f(a) + t(b) (1 t)m + tm = M. Donc f(x) max(f(a), f(b)). (ii) Soit [a, b] I. On a donc (a 0, b 0 ) I 2 tels que a 0 < a < b < b 0. Soit (x, y) [a, b] 2 disons avec x < y. On veut majorer par une constante k indépendante de x et y Par croissance des pentes, on est sûr que p y (a 0 ) p y (x) = p y (b 0 ). Mais p y (a 0 ) = p a0 (y). et p y (b 0 ) = p b0 (y). Donc on a : p a0 (y) p b0 (y). Encore par croissance des pentes, on a alors p a0 (a) p a0 (y) p b0 (y) p b0 (b). En posant k = max( p a0 (a), p b0 (b) ) (indépendant de x et y), on a alors et donc f est bien k-lipschitzienne sur [a, b]. k (iii) Soit x 0 I. Soit α > 0 tel que [x 0 α, x 0 + α] I. Par la question précédente, on a un k > 0 tel que f soit k-lip. sur [x 0 α, x 0 + α]. Donc x [x 0 α, x 0 + α], f(x) f(x 0 ) k et donc f(x) f(x 0 ) 0 et x x 0 f est bien continue en x 0. 0 si x ]0, 1[ (iv) Soit f [0, 1] R, x 1 si x = 0 ou x = 1 On vérifie facilement que f est convexe sur I par exemple avec la croissance de la fonction pente (les seules fonctions à examiner sur p 0 et p 1 qui sont bien croissantes car si x ]0, 1[, p 0 (x) = 0 1 x = 1/x et si x = 1, p 0(1) = 0. Bien sûr f est discontinue en 0 et en 1. d) (i) Soit x 0 I. On veut montrer que f admet une dérivée à gauche et à droite en x 0. Soit y 0 I tel que x 0 < y 0 (existe car x 0 I). Alors pour tout x < x 0, on a x < y 0, donc p x0 (x) p x0 (y 0 ) par croissance de p x0. Mais alors par le théorème de la limite monotone, p x0 étant croissante, majorée sur I ], x 0 [ par p x0 (y 0 ), elle admet une limite finie quand x x 0. Par définition, cette limite est la dérivée à gauche f (x 0 ). On peut raisonner exactement de la même façon à droite de x 0 en prenant un y 0 < x 0, pour montrer que f +(x 0 ) existe. Mais mieux, le raisonnement précédent donne aussi que f (x 0 ) p x0 (y) pour tout x 0 < y. Donc la fonction p x0 en restriction à I ]x 0, + [ est croissante minorée par f (x 0 ) donc par théorème de la limite monotone, elle a une limite quand y x + 0, qui est par déf. f +(x 0 ) et on l inégalité : f (x 0 ) f +(x 0 ) ( ). On voit donc de prouver non seulement que ces demi-dérivées existent, mais aussi les inégalités (1) et (4) dans la chaine suivante d inégalité pour tout x < y dans I. f g(x) (1) f d(x) (2) f(y) f(x) (3) f y x g(y) (4) f d(y). 4

Les inégalités (2) et (3) sont aussi immédiates, puisque par exemple pour (2), p x étant croissante, sa limite à droite quand z x + 0 sera inférieure à n importe laquelle de ses valeurs p x (y) pour y > x 0. (ii) Fait général : Soit f une fonction ayant une dérivée à gauche et à droite en un point x 0. Montrons que f est continue en x 0. On sait que pour tout x x 0, f(x) f(x 0 ) = (x x 0 ) f(x) f(x 0). Or pour x x + 0 (resp. x x 0), on sait que f(x) f(x 0) tend vers une limit finie (pas forcément la même), mais alors le produit par ( ) tend vers zéro. Donc f(x) f(x 0 ) tend vers zéro pour x x + 0 et x x 0 et f(x) f(x 0 ) = 0 pour x = x 0 donc f(x) f(x 0 ) 0. x x 0 Donc f est bien continue en x 0. (iii) Cas où f est strictement convexe : par l absurde si l inégalité (2) de la question (i) est une égalité, pour un certain y > x. Comme la fonction p x est croissante, cela signifie qu elle est constante sur un voisinage à droite de x de la forme ]x, y]. Mais alors f ]x,y] est affine, ce qui contredit la stricte convexité. De même avec l autre inégalté. e) (i) Sens : si on a f convexe et dérivable, les inégalités du d) (i) deviennent : pour tout x < y dans I f (x) f (y). Ceci démontre déjà que f est croissante sur I. En outre si I n est pas ouvert et qu on a par exemple I = [a, b[ aiors pour x = a et x < y, on a encore : f f(c) f(x) (x) f (y) pour tout c ]x, y[, car on sait que f est dérivable donc on c x sait que les (f(c) f(x))/(c x) ont une limite quand c tend vers x et par monotonie de p x cette limite est la borne inférieure de ces taux de variations. N.B. Si on a f strictement convexe, on applique les inégalités du d) (iii). Sens : on suppose que f est croissante. On veut montrer que f est convexe. On va utiliser la caractérisation par les pentes du a) (iii). f(y) f(x) f(z) f(y) Soit x < y < z. On veut montrer que. y x z y Or par T.A.F. il existe un c 1 ]x, y[ tel que f f(y) f(x) (c 1 ) = et il existe un c 2 ]y, z[ y x f(z) f(y) tel que = f (c 2 ). z y Faire un dessin et tout ceci deviendra évident! Par croissance (resp. stricte croissance) de f comme c 1 < c 2, on a f (c 1 ) f (c 2 ) (resp. f(y) f(x) f(z) f(y) inég. stricte) et donc (resp. inégalité stricte). y x z y (ii) Sens : on a f convexe sur I, dérivable. Soit x 0 I. On veut montrer que pour tout x I, f(x) f(x 0 ) + ( )f (x 0 ). Autrement dit, on veut montrer que pour tout x > x 0, f(x) f(x 0) f (x 0 ), ce qu on sait par l inégalité (3) du d) (i) et que pour tout x < x 0, on a f(x) f(x 0) f (x 0 ) ce qu on sait par l inégalité (4) de la même question. Remarque : si f est strictement convexe, on applique le d) (iii). 5

Sens : avec la question précédente, on peut montrer que f est croissante. Or si x 0 x 1, avec f(x 1 ) f(x 0 ) + (x 1 x 0 )f (x 0 ) et f(x 0 ) f(x 1 ) + (x 0 x 1 )f (x 1 ), on a f (x 0 ) f(x 1) f(x 0 ) f (x 1 ) ce qui donne la conclusion. x 1 x 0 f) (i) Soit c point intérieur à I tel que f(c) réalise le max. de f sur I. Soit (x, y) I 2 tels que x < c < y. Comme c réalise le max. de f sur I, et que x < c on sait que p c (x) = (f(x) f(c))/(x c) f(y) f(c) 0. De même p c (y) = 0. y c Mais comme x < y et p c est croissante, p c (x) p c (y). Ceci force p c (x) = p c (y) = 0. Donc pour tout x < c, p c (x) = 0 donc f(x) = f(c) et de même pour tout y > c, f(y) = f(c). Donc f est bien constante sur I. (ii) (1) Soit a I un point tel que f(a) est un min. local de f. On a donc un α > 0 tel que pour tout x [a α, a + α], f(x) f(a). Rédaction 1 : par l absurde : si on suppose qu il existe un b tel que f(b) < f(a). Deux cas possibles : b > a + α ou b < a α. On suppose p.ex. b > a + α l autre cas est analogue. On a alors f(a) f(a + α) et f(a + α) > f(b), contradiction avec la croissance de la pente au point a + α. Rédaction 2 : Prenons un x I tel que x > a + α. Par croissance de la fonction pente au point a, on a : f(a + α) f(a) f(x) f(a) 0. α x a En particulier f(x) f(a). De même pour x a α et donc on a bien un minimum global. (2) Rédaction 1 : toujours la même idée : par l absurde, on contredit la croissance des pentes. On sait déjà que m = f(x 0 ) = f(x 1 ) est un min. global donc en part. que pour tout x [x 0, x 1 ], f(x) m. Par l absurde, s il existe un x [x 0, x 1 ] tel que f(x) > m alors on contredit une fois encore la croissance de la fonction pente des cordes en x! Rédaction 2 : Pour tout x [x 0, x 1 ], par convexité, cf. c) (i) on sait que f(x) max(f(x 0 ), f(x 1 )) = m. Mais ici f(x 0 ) = f(x 1 ) = m le min. global (par la question précédente) de f sur I. Donc on a aussi f(x) m pour tout x I. Donc f(x) = m pour tout x [x 0, x 1 ]. (3) Rédaction 1 : comme f est convexe, Γ f est au-dessus de ses tangentes en tout point. Or en (x 0, f(x 0 )) on a une tangente horizontale, donc min. global. Rédaction 2 : Comme f est convexe, f est croissante. L hyp. f (x 0 ) = 0 donne f (x) 0 pour x < x 0 et f (x) 0 pour x > x 0 donc f est décroissante puis croissante, et on a bien un min. global en x 0. g) Propriétés plus difficiles : (i) Pseudo-dérivée seconde : Idée 1 : si f admet un maximum en un point x 0 (forcément intérieur car I ouvert) alors f 2 (x 0 ) 0 car en un minimum tous les f(x 0 + h) + f(x 0 h) 2f(x 0 ) sont négatifs, et donc la limite aussi. Idée 2 : On fixe trois points x < y < z dans I : on va montrer que f est convexe en montrant l inégalité sur les pentes des cordes partant de x. Pour montrer cela, on va considère la parabole qui est le polynôme d interpolation de Lagrange P de f aux points x < y < z. L inégalité des pentes est équivalente à dire que cette parabole est tournée vers le haut et cela signifie que le polynôme P est à dérivée seconde positive! Allons- y On considère P le polynôme d interpolation de Lagrange de f aux points x, y, z : il est de degré au plus deux. 6

Alors f P s annule aux points x, y, z. Donc f P admet un maximum local dans l intérieur de ]x, z[ : en effet : si on considère le max. de (f P ) sur [x, z] (existe par continuité) si jamais il est atteint au bord, il est aussi atteint en y. Donc il existe un x 0 ]x, z[ tel que (f P ) 2 (x 0 ) 0. Mais (f P ) 2 = f 2 P 2 = f 2 P car pour les fonctions D 2 la pseudo-dérivée seconde coïncide avec la vraie dérivée seconde. Donc f 2 (x 0 ) P (x 0 ) 0, mais f 2 (x 0 ) 0 donc P (x 0 ) 0. Mais ceci suffit pour conclure que P définit une parabole (ou bien une droite mais dans ce cas c est trivial) tournée vers le haut, et donc que les pentes sont dans le bon sens. (ii) Une fonction convexe qui admet un D.L. 2 est D 2 : On écrit f(x 0 + h) = f(x 0 ) + hf (x 0 ) + L 2 h2 + o(h 2 ) le D.L. 2. On veut montrer que f est D 2 en x 0. Idée 1 : encadrer la dérivée par les pentes On fixe h > 0. On fixe un x 1 ]x 0, x 0 + h[ qu on note x 1 = x 0 + (1 t)h avec t ]0, 1[ (la raison de ce coeff. (1 t) plutôt que t est pour que la différence x 0 + h x 1 soit plus jolie égale à th. On fixe de même un x 2 > x 0 + h, par exemple : x 2 = x 0 + (1 + t)h Par comparaison entre dérivée et pente des cordes pour f convexe, on sait que : f(x 0 + h) f(x 0 + (1 t)h) th En retranchant f (x 0 ) et en divisant par h on obtient : f (x 0 + h) f(x 0 + (1 + t)h) f(x 0 + h). th f(x 0 + h) f(x 0 + (1 t)h) thf (x 0 ) f (x 0 + h) f (x 0 ) f(x 0 + (1 + t)h) f(x 0 + h) thf (x 0 ). th 2 h th 2 Considérons le membre de Gauche : En remplaçant avec G = f(x 0 + h) f(x 0 + (1 t)h) thf (x 0 ) th 2 f(x 0 + h) = f(x 0 ) + hf (x 0 ) + h2 L 2 + h2 µ(h) f(x 0 + (1 t)h) = f(x 0 ) + (1 t)hf (x 0 ) + (1 t)2 h 2 L + h 2 (1 t) 2 µ((1 t)h) 2 où u µ(u) est une fonction qui tend vers zéro en zéro, dans G, on obtient : G = h 2 L 2 + h2 µ(h) (1 t)2 h 2 L + h 2 (1 t) 2 µ((1 t)h) 2. th 2 Mais h2 L 2 (1 t)2 h 2 = h 2 (t t2 2 2 ) = h2 t(1 t 2 ). Donc G = (1 t 2 )L + µ(h) + (1 t)2 µ((1 t)h. t Soit ε > 0 : on fixe t pour que (1 t 2 )L > L ε 2. Comme µ 0 pour t fixé, on sait qu il existe un h 0 > 0 tel que pour tout h [0, h 0 ], le terme µ(h) + (1 t) 2 µ((1 t)h soit plus petit en v.abs que ε/2. t Donc en part. pour ce t fixé et h [0, h 0 ], G L ε. 7

De même avec le le membre de droite du gros encadrement vu plus haut, on montre qu on a un h 1 tel que h [0, h 1 ], D L + ε. Donc pour h min(h 0, h 1 ), on a f (x 0+h) f (x 0) ]L ε, L + ε[. h On vient de vérifier la déf. de la limite pour le taux de variation f (x 0 + h) f (x 0 ) f est bien dérivable en x 0 de dérivée L. Remarque : on fait de même si h < 0. h donc 8