Estimatio du ombre de citatios de papillotes et de blagues Carambar Philippe Gambette gambette@lirmm.f r. Laboratoire d Iformatique, de Robotique et de Microélectroique de Motpellier. C.N.R.S., Uiversité Motpellier 2. 161 rue Ada, 34392 Motpellier Cedex 5 Frace. 8 jui 2009 RÉSUMÉ. Les papillotes et les carambars sot deux gourmadises d ivetio fraçaise dot l itérêt pricipal est, pour de ombreux cosommateurs peu gourmads, le papier qui les erobe. Celui-ci cotiet ue citatio [1], u rébus, u dessi humoristique, ue blague [2], ou plus récemmet ue créatio désopilate d Élie Semou 1. Ces messages divers sot extraits d u esemble fii pour limiter les coûts de productio. E supposat que la répartitio des messages à l itérieur d u sachet de papillotes Révillo ou bobos Carambar se fasse par tirage aléatoire (uiforme et idépedat), ous doos ue méthode pour estimer le ombre total de messages différets à partir d u échatillo (par exemple, u sachet). Cette avacée fodée sur des calculs statistiques permet doc de résoudre u mystère essetiel sur la fabricatio de ces gourmadises. MOTS-CLÉS : Papillote, combiatoire, statistiques, chocolat, Carambar. 1. Itroductio La papillote a été créée e 1790 à Lyo quad u appreti du chocolatier Papillot a été surpris e trai de dérober des chocolats qu il evoyait etourés d u billet doux à la demoiselle dot il était amoureux [1]. So employeur l a revoyé e preat soi de commercialiser so idée. Depuis, la papillote est deveue le chocolat traditioel des fêtes de fi d aée [3], fabriquée otammet par l etreprise Révillo Chocolatier, qui erobe les papillotes de sa gamme Festive par des citatios humoristiques ou philosophiques. Chaque citatio est présetée sur u petit papier qui e cotiet ue etière, aisi que des fractios d ue ou deux autres, à gauche et à droite. E observat la cosécutivité des citatios sur ces papiers, o se red compte qu elle est toujours maiteue, autremet dit que si ue citatio a apparaît immédiatemet à droite d ue autre b sur u papier, elle apparaîtra égalemet immédiatemet à droite de b sur tout autre papier qui la cotiet, comme motré e Figure 1(a). O peut doc raisoablemet e déduire que ces papiers provieet de l impressio puis du découpage d u dictioaire coteat u ombre fii de citatios das u ordre fixé. Les mêmes observatios peuvet être meées sur les blagues imprimées sur le papier erobat les Carambar, illustrées e Figure 1(b). Ces friadises, actuellemet commercialisées par Cadbury Schweppes, ot été créées e 1954 das l usie Delespaul-Havez. C est e 1969 que les blagues ot fait leur apparitio sur le papier d emballage [4]. Nous ous itéressos doc à l estimatio de la taille de ces dictioaires de citatios ou de blagues à partir d u échatillo (typiquemet, u sachet). O estime, raisoablemet, que les citatios présetes das l échatillo 1. http://www.carambar.fr/html/elie_semou.html
(a) (b) FIGURE 1. Recollage de citatios de papillotes Révillo (a) ou de blagues Carambar (b) chevauchates. sot obteues par u tirage aléatoire, uiforme (probabilités égales pour le tirage de chaque citatio) et idépedat (la probabilité de choisir ue citatio et la probabilité de choisir la suivate sot idépedates). 2. Estimatio du maximum de vraisemblace Nous choisissos de décrire u tirage de papillotes par le ombre d de citatios différetes piochées, et d estimer le ombre total de citatios différetes par maximum de vraisemblace par rapport à la valeur observée de d. Notos que cette formulatio du problème passe par ue discrétisatio des doées. E effet, les papiers coteat les citatios e sot pas découpés uiformémet. Tous fot apparaître ue citatio etière, aisi qu ue portio ou la totalité de la citatio qui la précède, et de celle qui la suit. Nous choisissos doc de représeter chaque papier d emballage coteat ue citatio par le uméro d idetifiat de la citatio qui est placée sur le poit cetral du papier. Nous procédos de même pour les blagues Carambar qui présetet exactemet le même problème. O cherche doc à calculer la probabilité P d,k () de tirer d citatios différetes parmi k piochées avec remise parmi u esemble de papillotes où les citatios différetes sot égalemet réparties. O peut aisémet défiir P d,k () par récurrece : P d,k () = P d 1,k 1 () d + 1 P 1,k () = 1 k 1 pour k, N, P d,1 () = 0 pour 1 < d N. + P d,k 1 () d pour 1 < d, k N, Pour obteir ue formule plus directe facilitat les calculs, o peut remarquer que le problème est équivalet au déombremet des mots de k lettres (choisies parmi u alphabet de lettres) coteat exactemet d lettres différetes. Appelos a d,k () ce ombre, o a doc : P d,k () = a d,k() k. (1) Remarquos à préset que pour calculer a d,k (), il suffit de calculer le ombre b d,k mots de k lettres dot d différetes choisies parmi u alphabet de taille d, et multiplier par toutes les faços possibles de projeter ces d lettres à l itérieur de l alphabet de taille. Ceci doe l égalité : ( ) a d,k () = b d,k. (2) d
Comme b d,k e déped pas 1 de, les égalités 1 et 2 suffiset pour calculer le maximum de P d,k () par rapport à : ( d) max P d,k() = max k. (3) 3. Résultats expérimetaux 3.1. Estimatio Nous avos effectué ue dégustatio de 52 papillotes Révillo de la gamme des papillotes Festives. Ce tirage a permis de déchiffrer (e utilisat le web pour compléter certaies citatios troquées) et affecter u idetifiat à 65 citatios. Le processus de discrétisatio des doées décrit e sectio 2 a coduit à trouver d = 40 citatios différetes parmi les k = 52 tirées. FIGURE 2. Probabilité de tirer 40 citatios différetes parmi 52, e foctio du ombre total de citatios différetes. Nous présetos e Figure 2 la courbe de probabilité du ombre de citatios différetes de ce tirage e foctio du ombre total de citatios différetes. Cette courbe atteit so maximum sur N pour = 93, avec ue probabilité de 16.5%. 3.2. Précisio Pour évaluer la précisio de ce résultat, ous créos plusieurs jeux de doées artificiels par u rééchatilloage de type Jack-kife, c est à dire u tirage aléatoire de 45 citatios parmi les 52 réellemet tirées, et ous effectuos les mêmes calculs, dot les résultats sot présetés das la Table 1. Ceux-ci permettet de fourir ue estimatio moyee de = 83 et u itervalle de cofiace de [74,108]. O peut doc s attedre à ue erreur de 30%. Tirage 1 2 3 4 5 6 7 8 9 10 d = 35 35 35 34 35 37 35 34 34 35 arg max P d,k () = 84 84 84 74 84 108 84 74 74 84 TABLE 1. Résultats de l estimatio du ombre de citatios sur 10 tirages aléatoires de 45 citatios parmi 52. 1. Le calcul de b d,k est détaillé sur http://www.physicsforums.com/showthread.php?t=301013.
E fait, répéter ue expériece similaire avec u tirage aléatoire de 25 citatios (voir Table 2) permet de motrer les limites de la méthode. E effet, les valeurs possibles de trouvées par maximum de vraisemblace arrivet das l itervalle [34,92], et coduiset à ue estimatio moyee de 56 citatios, alors que l o sait qu il y a au mois 65 citatios différetes. Tirage 1 2 3 4 5 6 7 8 9 10 d = 22 22 19 19 18 19 19 22 20 18 arg max P d,k () = 92 92 41 41 34 41 41 92 52 34 TABLE 2. Résultats de l estimatio du ombre de citatios sur 10 tirages aléatoires de 25 citatios parmi 52. L applicatio de ces petits tests pour doer ue idée de la précisio des doées ous semble doc idispesable afi d éviter de fourir des estimatios trop éloigées de la réalité. 3.3. Applicatio aux doées Carambar Cette méthode d estimatio a été utilisée sur les résultats obteus progressivemet à partir de tirages successifs, pour fourir les résultats présetés e Figure 3. Toutefois, ces résultats sot sous-estimés. E effet, la blague du 56ème Carambar dégusté a permis de costater que cotrairemet à otre hypothèse iitiale, ue blague est pas toujours précédée et suivie des mêmes. Aisi, il est possible que certaies blagues sur-représetées coduiset à des erreurs d estimatio. E outre, o peut remarquer que cotrairemet aux papillotes de largeur costate, les blagues Carambar, plus ou mois élaborées, ot pas ue hauteur costate, ce qui coduit à u tirage favorisé des blagues plus logues. Fialemet, ces problèmes coduiset probablemet à ue sous-estimatio du ombre total de blagues. FIGURE 3. Evolutio de l estimatio du ombre total de blagues Carambar (courbe bleue) e foctio de la taille du tirage, et du ombre de blagues différetes tirées (courbe rouge). 4. Coclusio Nous avos cotacté l etreprise Révillo Chocolatier 2 qui ous a aimablemet dévoilé que le ombre total de citatios pour la gamme des papillotes Festives était 108. Notre estimatio directe de 93 citatios correspod à ue erreur de 13,9%, soit u ordre de gradeur tout à fait satisfaisat. 2. http://www.papillotesrevillo.fr/
La précisio atteite par la méthode présetée ici semble améliorable, vraisemblablemet e choisissat u autre paramètre caractéristique du tirage pour l étude du maximum de vraisemblace : la taille de la plus logue séquece de citatios cosécutives, le ombre de citatios présetes 2 fois, la distributio des ombres d apparitios de citatios... Nous cherchos aussi à appliquer cette méthode sur d autres doées, comme sur celles de suivi des billets e euros du site EuroBillTracker 3, afi de vérifier si l o obtiet ue boe estimatio du ombre total de billets e euros e circulatio (11,8 milliards fi 2008 d après la Baque Cetrale Européee). Ceci coduit à u problème de calcul efficace avec de grads etiers, et icite à trouver ue formule directe d estimatio du maximum de vraisemblace. 5. Bibliographie [1] Collectif L ivetaire Du Patrimoie Culiaire De La Frace. Rhôe-Alpes - Produits Du Terroir Et Recettes Traditioelles. Albi Michel / CNAC - régio Rhôe-Alpes (1995). [2] Collectif. Les Blagues Carambar. Éditios Michel Lafo (2004). [3] Brigitte Brégeo-Poli. Va pour treize! La traditio des desserts de Noël e Provece. Terrai 24 (1995), pp. 145-152. [4] Cadbury Schweppes. Le dossier de marque Carambar. http://www.carambar.fr/dowload/dossiers/dossier_ de_marque_carambar.pdf (2008). 3. http://www.eurobilltracker.com