La distribution des couleurs dans la famille des G. Haesbroeck Département de Mathématique Université de Liège Printemps des Sciences 2014 G. Haesbroeck (ULg) M&M s 1 / 29
Plan de l exposé 1 Histoire des personnages m&m s et évolution de leurs couleurs 2 Distribution des couleurs des m&m s 3 Expérimentation: analyse statistique du contenu des sachets 4 Distribution théorique distribution empirique 5 Conclusion et autres applications G. Haesbroeck (ULg) M&M s 2 / 29
Histoire des m&m s En 1937: Création de l entreprise m&m s chocolate candies par Forrest Mars (fils de Franck Mars, fondateur des barres chocolatées Mars et Milky Way) et Bruce Murrie (fils du directeur de la société Hershey). En 1954: Lancement de vastes campagnes publicitaires télévisées où les m&m s sont représentés avec des bras et des jambes. G. Haesbroeck (ULg) M&M s 3 / 29
Evolution des couleurs des m&m s Avec un duo de choc: http://www.culturepub.fr/videos/m-m-s-run http://www.youtube.com/watch?v=mf-o7cpltc4 G. Haesbroeck (ULg) M&M s 4 / 29
Evolution des couleurs des m&m s Quelques difficultés: G. Haesbroeck (ULg) M&M s 5 / 29
Evolution des couleurs des m&m s Et de gros coups médiatiques (surtout aux USA): 1995: Election d une nouvelle couleur (10 millions de votants) 2012: Introduction d uun nouveau membre dans la famille m&m s G. Haesbroeck (ULg) M&M s 6 / 29
Distribution des couleurs des m&m s On s intéresse à la question: Couleurs Pourcentages????? Hypothèse: Répartition uniforme?? Somme 100% G. Haesbroeck (ULg) M&M s 7 / 29
Distribution des couleurs des m&m s G. Haesbroeck (ULg) M&M s 8 / 29
Distribution théorique Donc, sur un total de 100 bonbons, Couleurs Pourcentages 24% 14% 13% 20% 13% Selon cette répartition théorique, dans un sachet de 50 bonbons, on s attend à obtenir 0.24 50 = 12 bonbons bleus 0.14 50 = 7 bonbons jaunes... 16% Somme 100% Expérimentation: analyse statistique du contenu des sachets pour comparer ce que l on obtient par rapport à ce que l on nous promet! G. Haesbroeck (ULg) M&M s 9 / 29
Etape 1: Recherche de la distribution empirique des six couleurs dans un sachet de m&m s Couleurs Effectifs 8 4 10 8 11 9 Somme 50 G. Haesbroeck (ULg) M&M s 10 / 29
Etape 1: Recherche de la distribution empirique des six couleurs dans un sachet de m&m s G. Haesbroeck (ULg) M&M s 11 / 29
Représentation de la distribution des effectifs 20 8 0 2 4 6 8 10 16 22 16 18 G. Haesbroeck (ULg) M&M s 12 / 29
Etape 2: comparaison entre la distribution théorique et la distribution observée La distribution théorique est Couleurs Probabilités Effectifs attendus 0.24 12 0.14 7 0.13 6.5 0.20 10 0.13 6.5 0.16 8 Somme 1 50 Si on dispose de 50 bonbons... G. Haesbroeck (ULg) M&M s 13 / 29
Distributions théorique et observée Couleurs Effectifs Effectifs observés attendus 8 12 4 7 10 6.5 8 10 11 6.5 9 8 Somme 50 50 0 2 4 6 8 10 G. Haesbroeck (ULg) M&M s 14 / 29
Ecart entre distribution théorique et distribution observée Il y a un écart entre ce qui est observé et ce qui est attendu sous le modèle théorique: Couleurs Effectifs observés Effectifs attendus Ecart: obs att 8 12-4 4 7-3 10 6.5 3.5 8 10-2 11 6.5 4.5 9 8 1 Somme 50 50 G. Haesbroeck (ULg) M&M s 15 / 29
Ecart entre dist théorique et dist observée Il est normal d observer un écart non nul entre les effectifs observés et les effectifs attendus. Par exemple, sur 100 lancers d un Résultats Effectifs observés Effectifs attendus Ecart: obs att 1 17 16.6 0.4 2 15 16.6-1.6 3 19 16.6 1.6 4 15 16.6-1.6 5 9 16.6-7.6 6 25 16.6 8.4 Somme 100 100 Le tout est de déterminer si les écarts sont suffisamment petits pour être consistants avec l hypothèse émise ou si certains écarts sont trop grands. G. Haesbroeck (ULg) M&M s 16 / 29
Distances du χ 2 entre distribution théorique et distribution observée (1) Pour tester globalement l adéquation d un modèle théorique, un écart global entre les deux distributions est souhaité. Résultats Effectifs observés Effectifs attendus Ecart: obs attend 1 17 16.6 0.4 2 15 16.6-1.6 3 19 16.6 1.6 4 15 16.6-1.6 5 9 16.6-7.6 6 25 16.6 8.4 Somme 100 100 0.4 Calculer simplement la somme ne convient pas (les écarts positifs ont tendance à compenser les écarts négatifs). G. Haesbroeck (ULg) M&M s 17 / 29
Distances du χ 2 entre distribution théorique et distribution observée (2) Il faut supprimer le signe des écarts avant de calculer la somme. Résultats Effectifs Effectifs Ecart Ecarts 2 observés attendus 1 17 16.6 0.4 0.16 2 15 16.6-1.6 2.56 3 19 16.6 1.6 5.76 4 15 16.6-1.6 2.56 5 9 16.6-7.6 57.76 6 25 16.6 8.4 70.56 Somme 100 100 0.4 139.36 Il reste cependant encore une subtilité à prendre en considération avant d obtenir la distance du χ 2. G. Haesbroeck (ULg) M&M s 18 / 29
Distances du χ 2 entre distribution théorique et distribution observée (3) Répartition des groupes sanguins en Belgique: Résultats % Effectifs Effectifs Ecarts Ecarts 2 Distance attendus observés 0 44 44 44 47 3 3 9 9/44 = 0.204 A 45 45 40-5 25 25/45 = 0.55 B 8 8 7-1 1 1/8 = 0.125 AB 3 3 3 6 3 3 9 9/3 = 3 Somme 100 100 100 3.885 Il faut relativisier l écart par rapport à ce qui était attendu: écart au carré effectif attendu G. Haesbroeck (ULg) M&M s 19 / 29
Calcul de la distance du χ 2 pour le dé (hypothèse uniforme) Résultats Effectifs Effectifs Ecart Ecarts 2 Dist observés attendus 1 17 16.6 0.4 0.16 0.16/16.6=0.010 2 15 16.6-1.6 2.56 2.56/16.6=0.154 3 19 16.6 1.6 5.76 5.76/16.6=0.347 4 15 16.6-1.6 2.56 2.56/16.6=0.154 5 18 16.6 1.4 1.96 1.96/16.6=0.118 6 16 16.6-0.4 0.36 0.36/16.6=0.022 Somme 100 100 x x 0.805 00.805 Que dire de cette distance? G. Haesbroeck (ULg) M&M s 20 / 29
Distance acceptable ou pas? 00.805 OK OK OK 00.805 OK G. Haesbroeck (ULg) M&M s 21 / 29
Distances plausibles sous l hypothèse uniforme Deuxième expérience: Résultats Effectifs Effectifs Ecart Ecarts 2 Dist observés attendus 1 17 16.6 0.4 0.16 0.010 2 15 16.6-1.6 2.56 0.154 3 19 16.6 1.6 5.76 0.347 4 15 16.6-1.6 2.56 0.154 5 9 16.6-7.6 57.76 3.480 6 25 16.6 8.4 70.56 4.251 Somme 100 100 x x 8.396 00.805 2.612 4.419 8.396 G. Haesbroeck (ULg) M&M s 22 / 29
Distances plausibles sous l hypothèse uniforme Après 100 expériences: 2 4 6 8 10 12 Après 1000 expériences: 0 2 4 6 8 10 12 14 16 18 G. Haesbroeck (ULg) M&M s 23 / 29
Protocole de décision 95% 5% 0 2 4 6 8 10 12 14 16 18 dé 1 dé 2 On parle d une décision prise avec un risque de 5%. De plus, les distances ont le même comportement dès que le nombre d observations est suffisamment grand. G. Haesbroeck (ULg) M&M s 24 / 29
Retour à la distribution des m&m s Couleurs Effectifs Effectifs Ecart Ecarts 2 Distance observés attendus 8 12-4 16 16/12=1.33 4 7-3 9 9/7=1.28 10 6.5 3.5 12.25 12.25/6.5=1.88 8 10-2 4 4/10=0.40 11 6.5 4.5 20.25 20.25/6.5=3.11 9 8 1 1 1/8=0.125 Somme 50 50 8.14 G. Haesbroeck (ULg) M&M s 25 / 29
Conclusion 95% 5% 0dé 1 2 4 6 m&m dé 8 2 10 12 14 16 18 G. Haesbroeck (ULg) M&M s 26 / 29
Autres applications G. Haesbroeck (ULg) M&M s 27 / 29
Analyse des sondages politiques... a posteriori En vue des élections régionales de juin 2009, la RTBF (associée au groupe Vers l avenir et à l institut de sondage Dedicated Research) a présenté dans son journal de campagne le sondage suivant, basé sur 600 personnes et réalisé en mai 2009 (circonscription de Liège): Partis Pourcentages Pourcentages observés attendus PS 31.2 38.5 MR 27 20.1 Ecole 20.7 19.2 Cdh 12.4 12.1 FN 5.3 2.5 Autres 3.4 7.6 Somme 100 100 Le sondage était-il fidèle par rapport aux résultats obtenus? G. Haesbroeck (ULg) M&M s 28 / 29
Biologie et génétique Soit une espèce animale diploide, les femelles homogamétiques XX sont reconnaissables grâce à un dimorphisme sexuel apparent. Il existe dans une population un polymorphisme de coloration du pelage représenté par deux colorations: noir, blanc. Il y a 30% d individus noirs, la fréquence est la même chez les mâles et chez les femelles. Ce polymorphisme peut être utilisé afin de connaître le système de croisement en vigueur dans cette population. Couleurs (fem-mâle) Effectifs observés noir - noir 35 blanc - blanc 212 noir - blanc 163 Somme 410 Peut-on considérer au risque de 5% que les croisements sont panmictiques et pangamiques? G. Haesbroeck (ULg) M&M s 29 / 29