Le théorème du sandwich au jambon Florian Bouguet & Paul Schneider Ecole Normale Supérieure de Cachan - Antenne de Bretagne Travaux encadrés par Antoine Chambert-Loir Université de Rennes 1 1
2
Table des matières 1 Introduction 3 2 Le théorème original 4 2.1 Enoncé.......................................... 4 2.2 Approche en dimension 2............................... 4 2.3 Démonstration..................................... 5 2.4 A propos des hypothèses................................ 6 3 Le théorème discret 8 3.1 Position quelconque.................................. 8 3.2 Position générale.................................... 10 4 Algorithmes en dimension 2 11 4.1 Algorithme basique................................... 11 4.2 Algorithme optimal................................... 12 5 Conclusion 14 3
4
1 Introduction Le théorème du sandwich au jambon (parfois appelé de manière moins imagée théorème de Stone-Tukey) est un problème datant des années 1930, posé par Steinhaus et résolu pour la première fois par Banach. Voici la version d origine : étant donnés trois solides dans R 3, on peut trouver un plan séparant chacun de ces solides en deux parties de même volume. Cela se généralise au cas de d solides dans R d, pour d 2. Cas de la dimension 2 Ce théorème et ses nombreuses dérivées tiennent leur nom du cas tridimensionnel, dans lequel les trois objets sont couramment une tranche de pain, de jambon et de fromage. En dimension 2, il est parfois appelé théorème du pancake... 5
2 Le théorème original Dans cette partie, nous allons énoncer le théorème du sandwich au jambon, puis nous intéresser à l idée de la preuve en dimension 2. Nous verrons alors une démonstration rigoureuse dans le cas de la dimension d. 2.1 Enoncé On considèrera toujours dans la suite l espace mesurable (R d, B(R d )) avec d 2. Rappelons qu une mesure de Borel finie est une mesure µ sur R d telle que tout ouvert soit µ-mesurable, et que 0 µ(r d ) < +. On notera, pour tout hyperplan affine h, h (resp. h ) le demi-espace fermé positif (resp. négatif) et h > (resp. h < ) le demi-espace ouvert positif (resp. négatif). Définition 1 (Bissection). Considérons µ 1,..., µ k des mesures de Borel finies. Un hyperplan affine h de R d réalise une bissection de µ 1,..., µ k si i [[ 1, k ] µ i (h ) = µ i (h ). Théorème 1 (Théorème du sandwich au jambon). Soient µ 1,..., µ d des mesures de Borel finies. Si tout hyperplan est de mesure nulle pour chacune des µ i Alors h hyperplan de R d réalisant une bissection de µ 1,..., µ d. 2.2 Approche en dimension 2 Nous allons simplement donner une idée de la preuve en dimension 2. Une preuve complète sera effectuée dans la partie suivante, qui nécessitera l utilisation du théorème de Borsuk-Ulam. Des arguments plus simples suffisent dans le cas bidimensionnel, comme nous allons le voir maintenant. Considérons X 1, X 2 R 2 mesurables et bornés. On va montrer qu il existe une droite affine h réalisant une bissection de X 1 et X 2. Nous considererons µ i = λ 1I Xi (où λ est la mesure de Lebesgue sur R 2 ). Ce cas est plus réducteur que dans le cas de deux mesures de Borel finies quelconques, mais il est aussi plus simple et c est le premier à avoir été étudié. 6
Considérons u un vecteur de S 1. On peut définir H u l ensemble des droites affines orientées par u. Par continuité de λ, il existe h u H u réalisant une bissection de X 1. On peut alors définir f : S 1 R telle que f(u) = µ 2 (h u ) µ 2 (h u ). Soit u 0 S 1. Si f(u 0 ) = 0 alors µ 2 (h u 0 ) = µ 2 (h u 0 ). Si f(u 0 ) 0, on remarque que f( u 0 ) = f(u 0 ). f a l air continue sur S 1, donc, par le théorème des valeurs intermédiaires, u 1 S 1 tel que f(u 1 ) = 0, et donc µ 2 (h u 1 ) = µ 2 (h u 1 ). Quoi qu il en soit, on a donc trouvé un vecteur u tel que h(u) réalise une bissection de µ 1 et µ 2. 2.3 Démonstration Considérons µ 1,..., µ d des mesures de Borel finies. Nous allons utiliser le théorème de Borsuk-Ulam, il peut donc être utile de rappeler son énoncé : Théorème 2 (Théorème de Borsuk-Ulam). Soit f : S d R d. Si f est continue sur S d Alors u S d tel que f(u) = f( u). Démonstration du Théorème du sandwich au jambon : Soit u = (u 0,..., u d ) S d R d. On peut définir : h(u) = {x R d /x 1 u 1 + + x d u d = u 0 } h (u), h (u), h > (u) et h < (u) comme définis précédemment f(u) = (µ 1 (h (u)),..., µ d (h (u))) On obtient une fonction f : S d R d. Pour utiliser le théorème de Borsuk-Ulam, il nous reste à montrer que cette fonction f est continue sur S d. Pour cela, on va montrer que µ i (h ( )) est 7
continue sur S d pour tout i [[ 1, d ]. Introduisons quelques notations : Π : R d+1 R d tel que Π(v 0,..., v d ) = (v 1,..., v d ) g = 1I {h (u)} et g n = 1I {h (u n )} Considérons u n = (u n 0,..., u n d ) Sd R d+1 pour n N. Supposons que (u n ) u ; on souhaite montrer que f(u n ) f(u). Soit 1 i d. On va commencer par montrer que (g n ) converge simplement vers g µ i -presque partout. Soit x h > (u). ε > 0 tel que x Π(u) > u 0 + ε. L application v x Π(v) est continue sur S d car Π L(R d+1, R d ) et le produit scalaire de R d est continu. Donc N N tel que n N, x Π(u) x Π(u n ) < ε 2 et u 0 u n 0 < ε 2. x Π(u n ) > x Π(u) ε 2 > u 0 + ε 2 > u n o Donc x h > (u n ) pour n assez grand. On montre de la même façon que x h < (u) x h < (u n ) pour n assez grand. Donc, si on considère x R d \h(u), g n (x) g(x). Enfin, h(u) = {x R d /x 1 u 1 + + x d u d u 0 } est un hyperplan, donc µ i (h(u)) = 0. Donc (g n ) converge vers g µ i -presque partout. Les fonctions g n et g sont des indicatrices, qui sont donc majorées par 1I {Rd } L 1 (µ i ) (car µ i est finie). Par le théorème de convergence dominée de Lebesgue, on obtient donc que : 1I {h (u n )} dµ i = µ i (h (u n ) µ i (h (u) = 1I {h (u)} dµ i R d R d f est donc continue sur S d. Le théorème de Borsuk-Ulam peut donc être appliqué à f : il existe u 0 S d tel que f(u 0 ) = f( u 0 ). Par définition de h et h, on a la relation suivante : h (u 0 ) = h ( u 0 ). Donc i [[ 1, d ], µ i (h (u 0 )) = µ i (h ( u 0 )) = µ i (h (u 0 )). Donc h(u 0 ) réalise une bissection de µ 1,..., µ d. 2.4 A propos des hypothèses Nous venons donc de voir le théorème du sandwich au jambon dans sa version originale. Nous verrons plus tard d autres versions plus ou moins atypiques, mais revenons pour le moment sur 8
les hypothèses du théorème. Nous avons supposé que les µ 1,..., µ d sont des mesures de Borel finies, et que tout hyperplan est de mesure nulle pour chacune des µ i. Si l on ne peut pas vraiment revenir sur le caractère "mesure de Borel finies", on peut en revanche se demander pourquoi on suppose que tout hyperplan est de mesure nulle. Est-il possible d affaiblir cette hypothèse, ou bien est-elle nécessaire? Contre-exemple en dimension 2 Dans cet exemple, où A 1, A 2, B 2 et C 2 sont des points, il est impossible d effectuer une bissection. Cela est évidemment dû à la position particulière des points. On dit qu ils ne sont pas en position générale. Nous allons voir cela plus en détail dans la partie suivante. 9
3 Le théorème discret Dans toute cette partie, on considerera A 1,..., A d des ensembles de points disjoints finis non vides. Définition 2 (Position générale). Considérons A 1,..., A d des ensembles de points finis. A 1,..., A d sont en position générale si h hyperplan affine, h contient au plus d points de A 1 A d. Dans le cas discret, c est la définition de bissection qui va nous poser certains problèmes ; en effet, selon la position des ensembles, certaines définitions seront plus agréables que d autres... Contre-exemple typique en dimension 2 si les A i sont en position quelconque, nous aurons besoin d une définition plus faible que "chaque sous-espace contient le même nombre de points" pour obtenir l existence d une bissection. si les A i sont en position générale, en revanche, cette définition ne sera pas trop forte et tout se passera bien. 3.1 Position quelconque Définition 3 (Bissection faible). Considérons A 1,..., A k des ensembles de points finis. Un hyperplan affine h de R d réalise une bissection faible de A 1,..., A k si i [[ 1, k ] : { (h > A i ) 1 2 (A i) (h < A i ) 1 2 (A i) Théorème 3 (Théorème du sandwich au jambon discret - Position quelconque). Considérons A 1,..., A d des ensembles de points finis. Alors h hyperplan de R d réalisant une bissection faible de A 1,..., A d. Démonstration du Théorème du sandwich au jambon discret - Position quelconque : Etape 1 10
Supposons que les (A i ) soient impairs, et que A 1,..., A d soient en position générale (c est-àdire qu un hyperplan ne contient pas plus de d points de l union). Soit A ε i = {x Rd /d(x, A i ) ε} (nous remplaçons les points par des boules de rayon ε). On peut choisir ε > 0 suffisament petit pour qu un hyperplan intersecte au plus d boules de A ε 1 A ε d, car A 1,..., A d sont en position générale et qu ils sont finis. Appliquons alors le théorème du sandwich au jambon démontré précedemment : soit h réalisant une bissection de µ 1,..., µ d, où µ i = λ 1I Ai. A ε i possède un nombre impair de boules, donc h intersecte au moins l une d entre elles. Puisqu un hyperplan ne peut intersecter plus de d boules, alors h intersecte exactement une boule de chaque A ε i. Cette boule est évidemment coupée en deux par h, qui passe donc par le centre de cette boule. Donc h réalise une bissection faible de A 1,..., A d. Etape 2 Supposons toujours que les (A i ) soient impairs, mais les A 1,..., A d sont désormais en position quelconque. n N, on peut définir A i,n obtenu en bougeant chaque point de A i d au plus 1 n, de manière à ce que A 1,n,..., A d,n soient en position générale. Ceci est vrai car les A i sont finis, et il y a donc un nombre fini d hyperplans intersectant au moins d+1 points de A 1 A d. D après l étape 1, il existe h n = {x R d / a n x = b n }, où a n est un vecteur unitaire de R d, réalisant une bissection faible de A 1,n,..., A d,n. Les A i sont bornés, donc les A i,n également, ce qui implique que {b n R/n N } est un intervalle borné de R (on a en effet imposé que a n S d 1 ). Par compacité, il existe donc une suite extraite telle que (a nk, b nk ) (a, b) R d R. Notons h = {x R d / a x = b}. Comme nous l avons vu lors de la démonstration du théorème du sandwich au jambon, x h > (resp. h < ) x h > n k (resp. h < n k ) pour k assez grand. Donc, si (h > A i ) = p alors K N tel que k K, (h > n k A i ) p. Donc (h > A i ) 1 2 (A i). Le même raisonnement s applique évidemment à l autre demi-espace ouvert. Donc h réalise une bissection faible de A 1,..., A d. Etape 3 Pour finir, on ne fait plus d hypothèse sur la parité des (A i ). si (A i ) est pair, considérons x i A i et notons A i = A i\{x i } si (A i ) est pair, notons A i = A i (A i ) est impair, donc d après l étape 1, il existe h réalisant une bissection faible de A 1,..., A d. Si (A i) est pair, 1 2 (A i) = 1 2 (A i ) +1 donc, par définition de la bissection faible, rajouter x i à A i ne posera pas de problème. Donc h réalise une bissection faible de A 1,..., A d. 11
3.2 Position générale Définition 4 (Bissection forte). Considérons A 1,..., A k des ensembles de points finis. Un hyperplan affine h de R d réalise une bissection forte de A 1,..., A k si i [[ 1, k ] : (h > A i ) = 1 2 (A i) (h < A i ) = 1 2 (A i) (h A i ) 1 Théorème 4 (Théorème du sandwich au jambon discret - Position générale). Considérons A 1,..., A d des ensembles de points finis. Si A 1,..., A d sont en position générale Alors h hyperplan de R d réalisant une bissection forte de A 1,..., A d. Cette définition de la bissection forte est bien plus conforme à la notion définie dans le cas de mesures ne chargeant pas les hyperplans, mais malheureusement la position générale est, comme son nom ne l indique pas, un cas particulier... Démonstration du Théorème du sandwich au jambon discret - Position générale : Considérons h réalisant une bissection faible de A 1,..., A d. Quitte à changer le système de coordonnées, on peut supposer que h est l hyperplan horizontal : h = {x R d / x e d = 0}. Rappelons que {x 0,..., x k } est dit affinement indépendant si leur enveloppe affine est de dimension k (ce qui est aussi équivalent à dire que {x 1 x 0,..., x k x 0 } est linéairement indépendant). h peut contenir jusqu à d points de A 1 A d. Notons B = h (A 1 A d ), et notons b = (B). B est affinement indépendant. En effet, si ce n était pas le cas, son enveloppe affine serait de dimension au plus (b 2). En rajoutant (d b + 1) points de (A 1 A d ) à B (ensemble que l on nommeb ), l enveloppe affine de B est donc contenue dans un hyperplan et (B ) = d + 1 ; ceci contredit l hypothèse de position générale. On peut rajouter (d b) points de h à B affinement indépendants de B (on peut justifier cela par le théorème de la base incomplète). On obtient alors un ensemble C h affinement indépendant. On cherche à bouger légèrement h pour qu il n intersecte pas les points de B dont on ne veut pas (on veut un unique point des A i de taille impaire et aucun point des A i de taille paire. Considérons ε > 0. Pour tout a C, on note a ε = a si a / B ou si on veut garder a sur l hyperplan. Sinon, notons a ε = a ± εe d (selon que l on souhaite le placer strictement au-dessus ou en-dessous de l hyperplan). Notons C ε = {a ε /a C}. En utilisant "l équivalence" entre indépendance affine et indépendance linéaire rappelée plus haut, on montre que pour ε suffisamment petit, C ε est encore affinement indépendant. On peut donc définir de manière unique h ε l enveloppe affine de C ε. De même, pour ε suffisamment petit, h ε réalise toujours une bissection faible de A 1,..., A d. Cependant, par construction de h ε, on peut décaler les points gênants pour que la bissection soit forte. Donc h ε réalise une bissection forte de A 1,..., A d. 12
4 Algorithmes en dimension 2 Dans cette dernière partie, nous allons nous intéresser à deux algorithmes de construction d une droite bissectrice dans le plan. On considère donc deux ensembles de points finis A 1 et A 2, et l on souhaite trouver une droite effectuant une bissection faible de A 1 et A 2. Par définition de la bissection faible et sans perte de généralité, on peut supposer que les (A i ) sont impairs (sinon, on enlève arbitrairement un point de A i, on effectue l algorithme et on le rajoute). 4.1 Algorithme basique On suppose donc (A i ) = 2k i + 1. Par définition de la bissection faible, on ne veut pas plus de k i points de A i dans chaque demi-espace ouvert. Il en résulte qu au moins un point de chaque A i appartient à la droite bissectrice. Un algorithme brutal consiste donc à déterminer toutes les droites reliant un élément de A 1 à un élément de A 2, et à compter pour chacune d elle le nombre de points strictement au-dessus et strictement en-dessous (resp. à gauche et à droite pour une droite verticale). Cet algorithme n est évidemment pas optimal et possède même une complexité assez abominable...néanmoins, il ne nécessite aucune hypothèse et, malgré le temps de calcul, retourne de bons résultats : Bissection d ensembles de 8 et 11 points 13
Bissection d ensembles avec beaucoup de points 4.2 Algorithme optimal Pour obtenir la droite effectuant la bissection faible, l algorithme le plus répandu passe par la dualité point/droite. On associe à un point P (a, b) la droite D : y = 2ax + b. On obtient après transformation des ensembles H 1 et H 2 duaux de A 1 et A 2. Nous allons développer la notion de p-niveau d un ensemble de droites H. Il s agit d une ligne brisée contenant les points ayant exactement, à abscisse fixée, (p 1) points en-dessous d eux (ceci est bien défini car H ne contient pas de droite verticale) : 14
3-niveau de l ensemble de droites Enfin, on appelle niveau médian de H le (H) -niveau de H (par exemple, il s agit du 3- niveau d un ensemble de 5 droites). Le concept de p-niveau est intimement lié, par dualité, à la notion de p-ensemble (sous-ensemble de cardinal p d un ensemble de points, séparé de son complémentaire par une droite). Il n y a qu un pas à faire pour parler de théorème du sandwich au jambon... Le problème de la bissection se ramène, par dualité, à trouver une intersection des niveaux médians de H 1 et H 2. Dans l article de Matoušek que nous avons étudié, les hypothèses sont plutôt floues (il est notamment démontré que les niveaux médians se coupent en un nombre impair de fois, ce qui n est pas vrai pour tous les ensembles de points). Néanmoins, voici le schéma global de preuve, et il s agit d un algorithme optimal (de complexité O(n)) : Initialisation : On se donne un intervalle T = R, G i = H i, n i = (G i ). On va chercher à réduire T à l abscisse d un point d interection des niveaux médians. Etape 1 : Considérons n 1 n 2 (sinon, on change la numérotation). On divise l intervalle T en un nombre constant de sous-intervalles T i, dont la "bande verticale" V (T i ) = T i R contient au plus une fraction constante de points d intersection des droites de G 1. Etape 2 : On trouve un intervalle T i dont la V (T i ) possède un nombre impair d intersections du p 1 -niveau de G 1 et du p 2 -niveau de G 2. Etape 3 : On construit un trapèze τ V (T i ) contenant le p 1 -niveau de G 1 et intersectant au plus la moitié des droites de G 1. Etape 4 : On enlève de G 1 les droites n intersectant pas τ, T i devient T. 15
5 Conclusion Nous avons donc évoqué dans cet exposé trois différents théorèmes du sandwich au jambon : le cas général, le cas discret en position quelconque, et le cas discret en position générale. Il existe néanmoins une multitude de variantes : Sous les hypothèses du théorème du sandwich au jambon (d mesures de Borel finies ne chargeant pas les hyperplans) et en considérant p 1,..., p d [0, 1], il est possible de trouver un hyperplan h tel que µ i (h ) = p i µ i (R d ). Considérons une mesure de Borel finie de R d ne chargeant pas les hyperplans. Si d 3, il est possible de la diviser en 2 d zones de même mesure (le cas bidimensionnel est une excellente application du théorème du sandwich au jambon). Si d 5 ceci est impossible en général. Le problème est ouvert en dimension 4. Si l on a pn points bleus et pm points rouges en position générale dans le plan, il est possible de séparer celui-ci en p convexes contenant chacun n points bleus et m points rouges. Références [1] Timothy M. Chan. Remarks on k-level algorithms in the plane. 1999. [2] Jiri Matousek. Using the Borsuk-Ulam theorem. Springer, 2003. [3] Jiri Matousek, Chi-Yuan Lo, and William Steiger. Algorithms for ham-sandwich cuts. Discrete and Computationnal Geometry, 1994. [4] William Steiger and Jihui Zhao. Generalized ham-sandwich cuts. Discrete and Computationnal Geometry, 2009. 16