Estimation du nombre de citations de papillotes et de blagues Carambar

Documents pareils
Les Nombres Parfaits.

FEUILLE D EXERCICES 17 - PROBABILITÉS SUR UN UNIVERS FINI

Chapitre 3 : Fonctions d une variable réelle (1)

Limites des Suites numériques

Dénombrement. Chapitre Enoncés des exercices

UNIVERSITE MONTESQUIEU BORDEAUX IV. Année universitaire Semestre 2. Prévisions Financières. Travaux Dirigés - Séances n 4

1 Mesure et intégrale

STATISTIQUE : TESTS D HYPOTHESES

SÉRIES STATISTIQUES À DEUX VARIABLES

La France, à l écoute des entreprises innovantes, propose le meilleur crédit d impôt recherche d Europe

capital en fin d'année 1 C 0 + T C 0 = C 0 (1 + T) = C 0 r en posant r = 1 + T 2 C 0 r + C 0 r T = C 0 r (1 + T) = C 0 r 2 3 C 0 r 3...

Chap. 6 : Les principaux crédits de trésorerie et leur comptabilisation

Intégration et probabilités ENS Paris, TD (20)13 Lois des grands nombres, théorème central limite. Corrigé :

Polynésie Septembre Exercice On peut traiter la question 4 sans avoir traité les questions précédentes.

Le marché du café peut être segmenté en fonction de deux modes de production principaux : la torréfaction et la fabrication de café soluble.

Comportement d'une suite

Chap. 5 : Les intérêts (Les calculs financiers)

Chap. 6 : Les principaux crédits de trésorerie et leur comptabilisation

Deuxième partie : LES CONTRATS D ASSURANCE VIE CLASSIQUES

c. Calcul pour une évolution d une proportion entre deux années non consécutives

20. Algorithmique & Mathématiques

EXERCICES : DÉNOMBREMENT

Statistique Numérique et Analyse des Données

Processus et martingales en temps continu

II LES PROPRIETES DES ESTIMATEURS MCO 1. Rappel : M1 LA REGRESSION : HYPOTHESES ET TESTS Avril 2009

LES ÉCLIPSES. Éclipser signifie «cacher». Vus depuis la Terre, deux corps célestes peuvent être éclipsés : la Lune et le Soleil.

STATISTIQUE AVANCÉE : MÉTHODES

Exercice I ( non spé ) 1/ u 1 = u / Soit P la propriété : u n + 4. > 0 pour n 1. P est vraie au rang 1 car u 1

x +1 + ln. Donner la valeur exacte affichée par cet algorithme lorsque l utilisateur entre la valeur n =3.

4 Approximation des fonctions

Module 3 : Inversion de matrices

3.1 Différences entre ESX 3.5 et ESXi 3.5 au niveau du réseau. Solution Cette section récapitule les différences entre les deux versions.

Principes et Méthodes Statistiques

Consolidation. C r é e r un nouveau classeur. Créer un groupe de travail. Saisir des données dans un groupe

Chapitre 3 : Transistor bipolaire à jonction

Etude de la fonction ζ de Riemann

. (b) Si (u n ) est une suite géométrique de raison q, q 1, on obtient : N N, S N = 1 qn+1. n+1 1 S N = 1 1

2 ième partie : MATHÉMATIQUES FINANCIÈRES

Cours de Statistiques inférentielles

55 - EXEMPLES D UTILISATION DU TABLEUR.

CHAPITRE 2 SÉRIES ENTIÈRES

Logiciel de synchronisation de flotte de baladeurs MP3 / MP4 ou tablettes Androïd

Exercices de mathématiques

Processus géométrique généralisé et applications en fiabilité

Compte Sélect Banque Manuvie Guide du débutant

Exo7. Déterminants. = 4(b + c)(c + a)(a + b). c + a c + b 2c Correction. b + a 2b b + c. Exercice 2 ** X a b c a X c b b c X a c b a X

Chapitre 2 SONDAGE ALEATOIRE SIMPLE OU A PROBABILITES EGALES. 2.1 DEFINITIONS 2.2 SONDAGE ALEATOIRE SIMPLE SANS REMISE (PESR) 2.2.

Baccalauréat S Asie 19 juin 2014 Corrigé

TRANSFERT DE CHARGE DANS UN RÉSEAU DE PROCESSEURS TOTALEMENT CONNECTÉS (*) par Maryse BÉGUIN ( 1 )

Université Victor Segalen Bordeaux 2 Institut de Santé Publique, d Épidémiologie et de Développement (ISPED) Campus Numérique SEME

Formation d un ester à partir d un acide et d un alcool

* très facile ** facile *** difficulté moyenne **** difficile ***** très difficile I : Incontournable

Statistique descriptive bidimensionnelle

[ édité le 10 juillet 2014 Enoncés 1. Exercice 6 [ ] [correction] Si n est un entier 2, le rationnel H n =

Les algorithmes de tri

Université de Bordeaux - Master MIMSE - 2ème année. Scoring. Marie Chavent machaven/

Dénombrement. Introduction. 1 Cardinaux d'ensembles nis. ECE3 Lycée Carnot. 12 novembre Quelques dénitions

Statistiques appliquées à la gestion Cours d analyse de donnés Master 1

Mécanismes de protection contre les vers

Les nouveaux relevés de compte

Convergences 2/2 - le théorème du point fixe - Page 1 sur 9

Tempêtes : Etude des dépendances entre les branches Automobile et Incendie à l aide de la théorie des copulas Topic 1 Risk evaluation

Probabilités et statistique pour le CAPES

Donnez de la liberté à vos données. BiBOARD.

LES MESURES CLÉS DU PROJET DE LOI ÉCONOMIE SOCIALE ET SOLIDAIRE

* très facile ** facile *** difficulté moyenne **** difficile ***** très difficile I : Incontournable

Séquence 5. La fonction logarithme népérien. Sommaire

Suites et séries de fonctions

Nous imprimons ce que vous aimez!

Terminale S. Terminale S 1 F. Laroche

Etude Spéciale SCORING : UN GRAND PAS EN AVANT POUR LE MICROCRÉDIT?

Cours 5 : ESTIMATION PONCTUELLE

PROMENADE ALÉATOIRE : Chaînes de Markov et martingales

14 Chapitre 14. Théorème du point fixe

UV SQ 20. Automne Responsable d Rémy Garandel ( m.-el. remy.garandel@utbm.fr ) page 1

Neolane Leads. Neolane v6.0

Lorsque la sécurisation des paiements par carte bancaire sur Internet conduit à une concurrence entre les banques et les opérateurs de réseau

Réseaux d ondelettes et réseaux de neurones pour la modélisation statique et dynamique de processus

La tarification hospitalière : de l enveloppe globale à la concurrence par comparaison

Groupe orthogonal d'un espace vectoriel euclidien de dimension 2, de dimension 3

UNIVERSITÉ DE SFAX École Supérieure de Commerce

RECHERCHE DE CLIENTS simplifiée

Risque de longévité et détermination du besoin en capital : travaux en cours

Protection de votre réseau d entreprise:

LE PRINCIPE DU RAISONNEMENT PAR RÉCURRENCE

One Office Voice Pack Vos appels fixes et mobiles en un seul pack

STRATÉGIE DE REMPLACEMENT DE LUTTE CONTRE LA PUNAISE TERNE DANS LES FRAISERAIES DE L ONTARIO

Université Pierre et Marie Curie. Biostatistique PACES - UE

Contribution à la théorie des entiers friables

Augmentation de la demande du produit «P» Prévision d accroître la capacité de production (nécessité d investir) Investissement

Simulations interactives de convertisseurs en électronique de puissance

La fibre optique arrive chez vous Devenez acteur de la révolution numérique

RÈGLES ORDINALES : UNE GÉNÉRALISATION DES RÈGLES D'ASSOCIATION

Dares Analyses. Plus d un tiers des CDI sont rompus avant un an

Des résultats d irrationalité pour deux fonctions particulières

PROBLEMES DIOPTIMISATION EN NOMBRES ENTIERS J. L. NICOLAS

Gérer les applications

Examen final pour Conseiller financier / conseillère financière avec brevet fédéral. Recueil de formules. Auteur: Iwan Brot

S-PENSION. Constituez-vous un capital retraite complémentaire pour demain tout en bénéficiant d avantages fiscaux dès aujourd hui.

PREPARER SA RETRAITE

Transcription:

Estimatio du ombre de citatios de papillotes et de blagues Carambar Philippe Gambette gambette@lirmm.f r. Laboratoire d Iformatique, de Robotique et de Microélectroique de Motpellier. C.N.R.S., Uiversité Motpellier 2. 161 rue Ada, 34392 Motpellier Cedex 5 Frace. 8 jui 2009 RÉSUMÉ. Les papillotes et les carambars sot deux gourmadises d ivetio fraçaise dot l itérêt pricipal est, pour de ombreux cosommateurs peu gourmads, le papier qui les erobe. Celui-ci cotiet ue citatio [1], u rébus, u dessi humoristique, ue blague [2], ou plus récemmet ue créatio désopilate d Élie Semou 1. Ces messages divers sot extraits d u esemble fii pour limiter les coûts de productio. E supposat que la répartitio des messages à l itérieur d u sachet de papillotes Révillo ou bobos Carambar se fasse par tirage aléatoire (uiforme et idépedat), ous doos ue méthode pour estimer le ombre total de messages différets à partir d u échatillo (par exemple, u sachet). Cette avacée fodée sur des calculs statistiques permet doc de résoudre u mystère essetiel sur la fabricatio de ces gourmadises. MOTS-CLÉS : Papillote, combiatoire, statistiques, chocolat, Carambar. 1. Itroductio La papillote a été créée e 1790 à Lyo quad u appreti du chocolatier Papillot a été surpris e trai de dérober des chocolats qu il evoyait etourés d u billet doux à la demoiselle dot il était amoureux [1]. So employeur l a revoyé e preat soi de commercialiser so idée. Depuis, la papillote est deveue le chocolat traditioel des fêtes de fi d aée [3], fabriquée otammet par l etreprise Révillo Chocolatier, qui erobe les papillotes de sa gamme Festive par des citatios humoristiques ou philosophiques. Chaque citatio est présetée sur u petit papier qui e cotiet ue etière, aisi que des fractios d ue ou deux autres, à gauche et à droite. E observat la cosécutivité des citatios sur ces papiers, o se red compte qu elle est toujours maiteue, autremet dit que si ue citatio a apparaît immédiatemet à droite d ue autre b sur u papier, elle apparaîtra égalemet immédiatemet à droite de b sur tout autre papier qui la cotiet, comme motré e Figure 1(a). O peut doc raisoablemet e déduire que ces papiers provieet de l impressio puis du découpage d u dictioaire coteat u ombre fii de citatios das u ordre fixé. Les mêmes observatios peuvet être meées sur les blagues imprimées sur le papier erobat les Carambar, illustrées e Figure 1(b). Ces friadises, actuellemet commercialisées par Cadbury Schweppes, ot été créées e 1954 das l usie Delespaul-Havez. C est e 1969 que les blagues ot fait leur apparitio sur le papier d emballage [4]. Nous ous itéressos doc à l estimatio de la taille de ces dictioaires de citatios ou de blagues à partir d u échatillo (typiquemet, u sachet). O estime, raisoablemet, que les citatios présetes das l échatillo 1. http://www.carambar.fr/html/elie_semou.html

(a) (b) FIGURE 1. Recollage de citatios de papillotes Révillo (a) ou de blagues Carambar (b) chevauchates. sot obteues par u tirage aléatoire, uiforme (probabilités égales pour le tirage de chaque citatio) et idépedat (la probabilité de choisir ue citatio et la probabilité de choisir la suivate sot idépedates). 2. Estimatio du maximum de vraisemblace Nous choisissos de décrire u tirage de papillotes par le ombre d de citatios différetes piochées, et d estimer le ombre total de citatios différetes par maximum de vraisemblace par rapport à la valeur observée de d. Notos que cette formulatio du problème passe par ue discrétisatio des doées. E effet, les papiers coteat les citatios e sot pas découpés uiformémet. Tous fot apparaître ue citatio etière, aisi qu ue portio ou la totalité de la citatio qui la précède, et de celle qui la suit. Nous choisissos doc de représeter chaque papier d emballage coteat ue citatio par le uméro d idetifiat de la citatio qui est placée sur le poit cetral du papier. Nous procédos de même pour les blagues Carambar qui présetet exactemet le même problème. O cherche doc à calculer la probabilité P d,k () de tirer d citatios différetes parmi k piochées avec remise parmi u esemble de papillotes où les citatios différetes sot égalemet réparties. O peut aisémet défiir P d,k () par récurrece : P d,k () = P d 1,k 1 () d + 1 P 1,k () = 1 k 1 pour k, N, P d,1 () = 0 pour 1 < d N. + P d,k 1 () d pour 1 < d, k N, Pour obteir ue formule plus directe facilitat les calculs, o peut remarquer que le problème est équivalet au déombremet des mots de k lettres (choisies parmi u alphabet de lettres) coteat exactemet d lettres différetes. Appelos a d,k () ce ombre, o a doc : P d,k () = a d,k() k. (1) Remarquos à préset que pour calculer a d,k (), il suffit de calculer le ombre b d,k mots de k lettres dot d différetes choisies parmi u alphabet de taille d, et multiplier par toutes les faços possibles de projeter ces d lettres à l itérieur de l alphabet de taille. Ceci doe l égalité : ( ) a d,k () = b d,k. (2) d

Comme b d,k e déped pas 1 de, les égalités 1 et 2 suffiset pour calculer le maximum de P d,k () par rapport à : ( d) max P d,k() = max k. (3) 3. Résultats expérimetaux 3.1. Estimatio Nous avos effectué ue dégustatio de 52 papillotes Révillo de la gamme des papillotes Festives. Ce tirage a permis de déchiffrer (e utilisat le web pour compléter certaies citatios troquées) et affecter u idetifiat à 65 citatios. Le processus de discrétisatio des doées décrit e sectio 2 a coduit à trouver d = 40 citatios différetes parmi les k = 52 tirées. FIGURE 2. Probabilité de tirer 40 citatios différetes parmi 52, e foctio du ombre total de citatios différetes. Nous présetos e Figure 2 la courbe de probabilité du ombre de citatios différetes de ce tirage e foctio du ombre total de citatios différetes. Cette courbe atteit so maximum sur N pour = 93, avec ue probabilité de 16.5%. 3.2. Précisio Pour évaluer la précisio de ce résultat, ous créos plusieurs jeux de doées artificiels par u rééchatilloage de type Jack-kife, c est à dire u tirage aléatoire de 45 citatios parmi les 52 réellemet tirées, et ous effectuos les mêmes calculs, dot les résultats sot présetés das la Table 1. Ceux-ci permettet de fourir ue estimatio moyee de = 83 et u itervalle de cofiace de [74,108]. O peut doc s attedre à ue erreur de 30%. Tirage 1 2 3 4 5 6 7 8 9 10 d = 35 35 35 34 35 37 35 34 34 35 arg max P d,k () = 84 84 84 74 84 108 84 74 74 84 TABLE 1. Résultats de l estimatio du ombre de citatios sur 10 tirages aléatoires de 45 citatios parmi 52. 1. Le calcul de b d,k est détaillé sur http://www.physicsforums.com/showthread.php?t=301013.

E fait, répéter ue expériece similaire avec u tirage aléatoire de 25 citatios (voir Table 2) permet de motrer les limites de la méthode. E effet, les valeurs possibles de trouvées par maximum de vraisemblace arrivet das l itervalle [34,92], et coduiset à ue estimatio moyee de 56 citatios, alors que l o sait qu il y a au mois 65 citatios différetes. Tirage 1 2 3 4 5 6 7 8 9 10 d = 22 22 19 19 18 19 19 22 20 18 arg max P d,k () = 92 92 41 41 34 41 41 92 52 34 TABLE 2. Résultats de l estimatio du ombre de citatios sur 10 tirages aléatoires de 25 citatios parmi 52. L applicatio de ces petits tests pour doer ue idée de la précisio des doées ous semble doc idispesable afi d éviter de fourir des estimatios trop éloigées de la réalité. 3.3. Applicatio aux doées Carambar Cette méthode d estimatio a été utilisée sur les résultats obteus progressivemet à partir de tirages successifs, pour fourir les résultats présetés e Figure 3. Toutefois, ces résultats sot sous-estimés. E effet, la blague du 56ème Carambar dégusté a permis de costater que cotrairemet à otre hypothèse iitiale, ue blague est pas toujours précédée et suivie des mêmes. Aisi, il est possible que certaies blagues sur-représetées coduiset à des erreurs d estimatio. E outre, o peut remarquer que cotrairemet aux papillotes de largeur costate, les blagues Carambar, plus ou mois élaborées, ot pas ue hauteur costate, ce qui coduit à u tirage favorisé des blagues plus logues. Fialemet, ces problèmes coduiset probablemet à ue sous-estimatio du ombre total de blagues. FIGURE 3. Evolutio de l estimatio du ombre total de blagues Carambar (courbe bleue) e foctio de la taille du tirage, et du ombre de blagues différetes tirées (courbe rouge). 4. Coclusio Nous avos cotacté l etreprise Révillo Chocolatier 2 qui ous a aimablemet dévoilé que le ombre total de citatios pour la gamme des papillotes Festives était 108. Notre estimatio directe de 93 citatios correspod à ue erreur de 13,9%, soit u ordre de gradeur tout à fait satisfaisat. 2. http://www.papillotesrevillo.fr/

La précisio atteite par la méthode présetée ici semble améliorable, vraisemblablemet e choisissat u autre paramètre caractéristique du tirage pour l étude du maximum de vraisemblace : la taille de la plus logue séquece de citatios cosécutives, le ombre de citatios présetes 2 fois, la distributio des ombres d apparitios de citatios... Nous cherchos aussi à appliquer cette méthode sur d autres doées, comme sur celles de suivi des billets e euros du site EuroBillTracker 3, afi de vérifier si l o obtiet ue boe estimatio du ombre total de billets e euros e circulatio (11,8 milliards fi 2008 d après la Baque Cetrale Européee). Ceci coduit à u problème de calcul efficace avec de grads etiers, et icite à trouver ue formule directe d estimatio du maximum de vraisemblace. 5. Bibliographie [1] Collectif L ivetaire Du Patrimoie Culiaire De La Frace. Rhôe-Alpes - Produits Du Terroir Et Recettes Traditioelles. Albi Michel / CNAC - régio Rhôe-Alpes (1995). [2] Collectif. Les Blagues Carambar. Éditios Michel Lafo (2004). [3] Brigitte Brégeo-Poli. Va pour treize! La traditio des desserts de Noël e Provece. Terrai 24 (1995), pp. 145-152. [4] Cadbury Schweppes. Le dossier de marque Carambar. http://www.carambar.fr/dowload/dossiers/dossier_ de_marque_carambar.pdf (2008). 3. http://www.eurobilltracker.com