1 ère S Exercices sur loi binomiale et échantillonnage 1 Une compagnie aérienne procède à l'évaluation de l efficacité de son standard téléphonique. Une étude considère que 0 % des appels téléphoniques ont pour objet l achat d un billet. Dans un échantillon de 100 appels, on en compte 18 dont l objet est un achat de billets. Dans un deuxième échantillon de 100 appels, on en compte 9. Dans un troisième échantillon de 00 appels, on en compte 44. 1 ) Commenter la représentativité des échantillons utilisés. ) Combien d appels ayant pour objet un achat de billet peut-on s'attendre à trouver dans un échantillon de 000 appels téléphoniques? La proportion de gauchers en France est estimée à 13 %. Parmi les 93 élèves de première d un lycée, 17 sont gauchers. On souhaite savoir si la fréquence des gauchers observée sur cet échantillon est en accord avec la proportion p de gauchers de la population française. Pour cela, on fait l hypothèse que la proportion de gauchers dans le lycée est de 13 %. 1 ) X est la variable aléatoire qui indique le nombre de gauchers dans un échantillon aléatoire de 93 personnes sous l hypothèse p = 0,13. Justifier que X suit une loi binomiale de paramètres n = 93 et p = 0,13. ) On donne ci-dessous un extrait de la table des probabilités cumulées P(X k). k P(X k) 5 0,0139 6 0,0341 7 0,0715 17 0,9467 18 0,9706 19 0,9846 0 0,994 Déterminer l intervalle de fluctuation au seuil de 95 % de la fréquence des gauchers. 3 ) La fréquence des gauchers dans cet échantillon d élèves est-elle en accord avec la proportion de gauchers de la population française? 3 Le maire d une ville affirme que 50 % des automobilistes qui traversent sa ville dépassent la vitesse autorisée 50 km/h. Un contrôle de police a constaté que sur 56 véhicules, 115 étaient en infraction. 1 ) On souhaite savoir si le maire a raison. On suppose alors que la proportion d automobilistes en infraction est p = 0,5. On note X la variable aléatoire qui indique le nombre d infractions sur un échantillon aléatoire de 56 personnes. a) Quelle est la loi de X? b) Utiliser l extrait ci-dessous de la table des probabilités cumulées pour déterminer un intervalle de fluctuation au seuil de 95 %. k P(X k) 111 0,0195 11 0,06 113 0,0349 114 0,0457 143 0,9738 144 0,9805 145 0,9857 146 0,9897 ) a) Quelle est la fréquence observée f des infractions de vitesse? b) Peut-on considérer, au seuil de risque de 5 %, que l affirmation du maire est exacte? 4 Une chaîne d embouteillage d eau minérale assure une production dont on estime que les réglages peuvent conduire à la proportion de 5 % de bouteilles défectueuses. On contrôle la production en prélevant un échantillon de 00 bouteilles ; on découvre 17 bouteilles défectueuses. 1 ) On suppose que la production de bouteilles défectueuses est de 5 %. X est la variable aléatoire qui donne le nombre de bouteilles défectueuses sur un échantillon aléatoire de 00 bouteilles. a) Préciser la loi de probabilité X. 1 b) Utiliser la calculatrice pour compléter le tableau suivant (valeurs à 10 000 près) : k 3 4 15 16 17 P(X k) c) En déduire les bornes de l intervalle de fluctuation au seuil de 95 %. ) a) Peut-on affirmer, au seuil de 5 %, que la chaîne fonctionne correctement? b) Calculer P (X 3) + P (X 17). Que représente cette probabilité?
5 Un fournisseur d accès internet propose des abonnements incluant la fourniture d un modem ADSL. La proportion de modem présentant des anomalies est estimée par le fournisseur à p = 0,16. Une association de consommateurs lance une enquête auprès des abonnés à sa revue pour estimer leur degré de satisfaction concernant leur fournisseur d accès. Parmi les réponses à l enquête, 48 concernent ce fournisseur d accès : 86 abonnés déclarent avoir reçu un modem défectueux. 1 ) On suppose que la proportion de modems défectueux est 0,16. On appelle X la variable aléatoire qui, à un échantillon aléatoire de 48 modems du fournisseur, associe le nombre de modems défectueux. a) Préciser la loi de probabilité X. b) Utiliser l extrait de la table de probabilités cumulées ci-dessous pour déterminer l intervalle de fluctuation à 95 %. k P (X k) 53 0,015 54 0,098 55 0,0406 56 0,0543 83 0,9739 84 0,9806 85 0,9858 86 0,9897 ) a) Quelle est la fréquence observée f sur l échantillon de l association de consommateurs? b) Peut-on estimer, au seuil de 5 %, que l association de consommateurs donne une information qui confirme les indications du fournisseur d accès? c) Quelle est la probabilité de commettre une erreur lors de la prise de décision? 6 La parité hommes-femmes dans une entreprise suppose que la fréquence théorique d'emploi des femmes par rapport à l ensemble des employés soit égale à 0,5. On s intéresse à deux sociétés A et B qui comptent respectivement 100 et 00 employés. 1 ) Dans l hypothèse où la parité est respectée, écrire pour chacune des deux sociétés, un intervalle de fluctuation de la fréquence d emploi des femmes au seuil de 90 %. ) Dans la réalité, les sociétés A et B emploient toutes les deux 43 % de femmes. Commenter ce pourcentage. 7 Une association vend des billets de loterie dont 1 sur 5 est gagnant. Dans un échantillon de n billets, on note f la fréquence des billets gagnants. 1 ) Le tableau ci-dessous donne, suivant les valeurs de n, l'intervalle de fluctuation de f au seuil de 95 % et son amplitude. Recopier et compléter ce tableau. Taille de l échantillon Intervalle de fluctuation Amplitude n = 0 n = 50 n = 100 n = 00 n = 500 ) Expliquer pourquoi l amplitude de l intervalle diminue lorsque la taille de l échantillon augmente. 3 ) Quelle doit être la taille de l'échantillon pour que l amplitude de l'intervalle de fluctuation soit inférieure ou égale à 5 10? 8 Il naît en France environ 105 garçons pour 100 filles. La maternité d une ville du sud de la France annonce pour l année 010, la naissance de 504 filles et de 486 garçons. Des articles signalent le phénomène dans la presse locale et les habitants s émeuvent, mais on se propose de déterminer si le résultat est exceptionnel. 1 ) Lors d une naissance en France, quelle est la probabilité p qu il s agisse d une fille? ) Dans un échantillon de 990 naissances (504 + 486), on note X le nombre de filles. En prenant p pour valeur de la probabilité de naissance d'une fille, déterminer la loi de probabilité suivie par la variable aléatoire X. Préciser ses paramètres. 3 ) Déterminer l intervalle de fluctuation au seuil de 95 % de la fréquence de naissances d une fille dans un échantillon de taille 990. 4 ) Quelle est la fréquence de naissances de filles dans la maternité étudiée? 5 ) Le résultat est-il exceptionnel? 9 Romain se vante d avoir un dé truqué qui lui permet d obtenir la face numérotée 6 en moyenne une fois sur trois. Camille doute des dires de son camarade. Elle lui emprunte le dé et réalise 100 lancers. Elle calcule alors la fréquence d apparition de la face 6 et obtient f = 0,3. Quelle réponse Camille donne-t-elle à Romain? 10 Une urne contient un très grand nombre de jetons noirs et de jetons blancs. Les proportions de jetons de chaque couleur sont inconnues mais Paul pense que l urne contient 60 % de jetons blancs. Louise propose de tirer 100 jetons de l urne au hasard et avec remise et de calculer la fréquence f de jetons blancs dans l échantillon. 1 ) Dans l hypothèse où Paul a raison, déterminer l intervalle de fluctuation au seuil de 95 % de la fréquence f. ) Énoncer la règle de décision permettant de rejeter ou non l'hypothèse p = 0,6 selon la valeur de la fréquence f du nombre de jetons blancs de l échantillon. 3 ) Louise a obtenu f = 0,51. Rejette-t-elle ou non l hypothèse de Paul?
11 Défauts de fabrication Dans une usine de fabrication, un produit peut présenter deux défauts : le défaut A avec une probabilité égale à 0,1 ; le défaut B avec une probabilité égale à 0,. Les deux défauts sont indépendants l un de l'autre. 1 ) On simule, à l aide d un programme, le choix d'un échantillon de taille n de ce produit et on affiche la fréquence des produits qui présentent l un au moins des deux défauts. Voici, rédigé en langage naturel, l algorithme correspondant à cette simulation. Variables : n, i, k : entiers naturels x, y, f : réels Entrée : Saisir n Initialisation : k prend la valeur 0 Traitement : Pour i allant de 1 à n Faire x prend la valeur d un réel aléatoire dans [0 ; 1[ y prend la valeur d un réel aléatoire dans [0 ; 1[ Si (x 0,1 ou y 0,) alors k prend la valeur k + 1 FinSi FinPour f prend la valeur k n Sortie : Afficher f 1 Entre les deux tours d une élection présidentielle, il ne reste que deux candidats A et B en lice. Lors d un débat télévisé, A affirme sur la foi d un sondage secret que si l élection avait lieu maintenant, il gagnerait largement avec 60 % des voix. Avant la fin du débat, B fait effectuer un sondage par téléphone auprès de 00 personnes en âge de voter. Le résultat donne 104 personnes en faveur de A. 1 ) En supposant que le sondage secret reflète fidèlement l opinion des électeurs le jour du débat, donner l intervalle de fluctuation à 95 % de la fréquence des personnes favorables à A sur un échantillon aléatoire de 00 personnes. ) Que peut-on dire à la suite du résultat du sondage commandé par B? 3 ) Reprendre les questions 1 ) et ) en fixant le seuil de l intervalle de fluctuation à 98 %. 13 Discrimination En novembre 1976 dans un comté du sud du Texas, Rodrigo Partida est condamné à huit ans de prison. Il attaque ce jugement au motif que la désignation des jurés de ce comté est, selon lui, discriminante à l égard des Américains d origine mexicaine. Alors que 80 % de la population du comté est d origine mexicaine, sur les 870 personnes convoquées pour être jurés lors des années précédentes, il n y a eu que 339 personnes d origine mexicaine. Devant la Cour Suprême, un expert statisticien produit des arguments pour convaincre du bien fondé de la requête de l accusé. En se situant dans le rôle de cet expert, peut-on décider si les Américains d origine mexicaine sont sousreprésentés dans les jurys de ce comté? 14 Test unilatéral : défauts de mitigeurs Une entreprise de bâtiment a constaté qu un certain nombre de mitigeurs thermostatiques avait un mauvais fonctionnement. L entreprise pose 304 mitigeurs. Le pourcentage de pièces ayant ln défaut est de 5 %. Soit X la variable aléatoire qui, à tout échantillon de 304 pièces, associe le nombre de défauts. 1 ) Quelle loi suit X? Visualiser le diagramme en bâtons ou en barres de la loi de X sur calculatrice ou sur tableur. ) Déterminer le plus petit entier naturel a tel que P (X a) > 0,95. 3 ) On veut construire un test qui, à partir de la fréquence f, observée dans un échantillon de taille 304, permette de dire si l on rejeter l hypothèse selon laquelle le pourcentage de pièces avec défaut est de 5 %. Énoncer la règle de décision. Piste : Définir un intervalle de fluctuation à 95 % de la forme [0 ; a n ]. 4 ) On sait qu il y a 18 défauts sur 304 pièces. Conclure. a) Expliquer ce que représente chacune des variables de cet algorithme. b) Saisir et exécuter le programme correspondant à cet algorithme pour des échantillons de taille n = 1 000, n = 5 000, n = 10 000. On utilisera le générateur de nombres «pseudo-aléatoires» de la calculatrice. c) Que remarque-t-on pour les fréquences affichées? ) Dans cette question, on prendra 0,8 pour probabilité «théorique» qu un produit présente l un au moins des deux défauts. On effectue un contrôle de 100 produits. a) Déterminer un intervalle de fluctuation au seuil de 90 % de la fréquence des produits qui présentent l'un au moins des deux défauts. b) Le fabricant prétend que, sur un tel échantillon, moins de 0 % des produits présentent l un au moins des deux défauts. Que peut-on en penser?
15 Test unilatéral : le magicien Un magicien prétend qu il peut souvent deviner à distance couleur d'une carte tirée au hasard d un jeu de cartes bien battu et comportant des cartes de deux couleurs différentes en nombre égal. On appelle p la probabilité que le magicien donne une réponse juste lors d un tirage. 17 La méthode de Monte-Carlo On veut calculer par une méthode probabiliste l'aire S du domaine plan D compris entre la courbe représentative C de la fonction «carré», l axe des abscisses et la droite d équation x = 1. Si le magicien est un imposteur, on a p = 1 sinon p > 1. On fait l hypothèse que le magicien est un imposteur. Soit X la variable aléatoire qui, à tout échantillon de taille 100, associe le nombre de succès obtenus par le magicien au cours des 100 tirages d'une carte. 1 ) Quelle est la loi suivie par X? C C B ) Déterminer le plus petit entier naturel a tel que P (X a) > 0,95. 3 ) On veut construire un test qui, à partir de la fréquence f observée dans un échantillon de taille 100, permette de décider si le magicien a répondu au hasard, avec un risque d'erreur de 5 %. Énoncer la règle de décision de ce test. 4 ) Sur 100 tirages, le magicien a obtenu 64 succès. Peut-on considérer, au seuil de risque 5 %, que le magicien est un imposteur? 16 Un exemple de rejet unilatéral j O i A Un examen consiste à répondre à un QCM constitué de 0 questions indépendantes. Pour chaque question, 3 réponses sont proposées dont une seule est exacte. Les examinateurs doivent fixer le nombre n de bonnes réponses nécessaires pour être reçu sachant que 95 % environ des élèves qui répondent au hasard doivent être recalés. 1 ) On se place dans l hypothèse où le candidat répond au hasard et on note X le nombre de réponses exactes données par ce candidat. a) Justifier que la variable aléatoire X suit une loi binomiale. Quels sont ses paramètres? b) Calculer l'espérance de X. ) a) Dans un tableau, donner les probabilités P(X k) pour k entier de 0 à 0. b) À l aide de ce tableau, donner une valeur approchée à P(X < 11) P(X 11). 10 près des probabilités : c) Quelle valeur de n les examinateurs arrêteront-ils pour être reçu à l examen? 3 ) Un candidat a préparé sérieusement l examen. On suppose par exemple que la probabilité qu il réponde correctement à chacune des questions est p = 0,6. a) Refaire un tableau adapté à ce candidat. b) Quelle est la probabilité que ce candidat échoue à l examen (avec la valeur de n choisie à la question ) c))? Ce résultat paraît-il raisonnable? Pour cela, on place un point au hasard, sur le carré OABC, puis on répète cette expérience aléatoire n fois de façon indépendante. On appelle X la variable aléatoire égale au nombre de points qui sont dans le domaine D. On admet que la probabilité qu'un point tombe dans D est égale au rapport des aires de D et du carré, soit S (car l aire du carré est égale à 1). 1 ) Quelle loi de probabilité que suit X? Donner E(X). ) En déduire qu on peut obtenir une valeur approchée de S par cette méthode. 3 ) Élaborer un algorithme (rédigé en langage naturel) qui simule n lancers d un point sur le carré, et qui calcule en sortie une valeur approchée de S. 4 ) Programmer cet algorithme sur une calculatrice, puis le faire fonctionner pour n = 100, puis pour n = 300. Point Histoire : La méthode Monte-Carlo (décrite pour la première fois en 1949) permet de calculer des valeurs par des techniques probabilistes : elle a été développée par John Von Neumann et Stanislas Ulam lors de la Seconde Guerre mondiale et des recherches sur la fabrication de la bombe atomique. Elle doit son nom aux jeux de hasard pratiqués à Monte-Carlo.
1 Notions intuitives d échantillons représentatifs Corrigé 1 ) Dans un échantillon de 100 appels, on pouvait s attendre à obtenir 0 appels ayant pour objet l'achat d'un billet. Pour le premier échantillon, l écart entre 18 et 0 est suffisamment faible pour être dû aux fluctuations d échantillonnage. La représentativité de l'échantillon semble correcte. Pour le deuxième échantillon, l écart entre 9 et 0 est assez important. La représentativité de l'échantillon peut être mise en doute. Pour le troisième échantillon, on pouvait s attendre à compter 40 appels ayant pour objet l achat d'un billet. L écart entre 44 et 40 est suffisamment faible pour être dû aux fluctuations d'échantillonnage. La représentativité de l échantillon semble correcte. ) On peut s'attendre à obtenir en théorie 0 % de 000, soit 400 appels ayant pour objet l'achat d'un billet. Les fluctuations d'échantillonnage laissent penser que ce nombre, en pratique, sera situé autour de cette valeur de 400. Si le nombre observé est nettement différent de 400 (par exemple 600), alors on pourra mettre en doute la représentativité de l'échantillon. 1 ) X indique le nombre de succès (S : «être gaucher») dans un schéma de Bernoulli d ordre 93, donc X suit une loi binomiale de paramètres n = 93 et p = 0,13 ) P(X 5) 0,0139 et P(X 6) 0,0341 donc a = 6. P(X 18) 0,9706 et P(X 19) 0,9846 donc b = 19. D où l intervalle de fluctuation à 95 % : I = [ 6 93 ; 19 93 ]. 3 ) La fréquence observée ( 17 ) appartient à I. 93 La fréquence observée est en accord avec la proportion de 13 % de gauchers en France au seuil de 95 %. Solution détaillée : 1 ) L expérience aléatoire qui consiste à choisir une personne au hasard dans la population des élèves de première du lycée est une épreuve de Bernoulli dans laquelle on appellera succès l événement S : «être gaucher». La probabilité d un succès est égale à 0,13. Comme on répète cette épreuve 93 fois dans des conditions identiques indépendantes, on a un schéma de Bernoulli. La variable X qui compte le nombre de succès d ordre 93, donc X suit la loi binomiale de paramètres n = 93 et p = 0,13 (notée B(93 ; 0,13)). ) On cherche : - le plus petit entier naturel a tel que P (X a) > 0,05 ; - le plus petit entier naturel b tel que P (X b) 0,975. Donc l intervalle de fluctuation de la fréquence des gauchers au seuil de 95 % est I = [ 6 93 ; 19 93 ]. 17 3 ) La fréquence des gauchers parmi les premières est égale f obs=. 93 f obs I donc on ne rejette pas l hypothèse p = 0,13. 3 Contrôle de police 1 ) a) X suit la loi binomiale B(56 ; 0,5). b) I = [ 11 56 ; 144 56 ] 115 ) a) f 56 b) f I donc on ne rejette pas l affirmation du maire au seuil de 95 %. 4 1 ) a) X suit la loi binomiale B (00 ; 0,05). b) On utilise la calculatrice (on peut aussi utiliser un programme sur calculatrice). k 3 4 15 16 17 P(X k) 0,009 0,064 0,9956 0,976 0,9879 4 c) I = [ 00 ; 16 00 ] ) a) f I donc on rejette l hypothèse que la chaîne fonctionne correctement. b) P (X 3) + P (X 17) = P (X 3) + 1 P (X 16) Donc P (X 3) + P (X 17) 0,038 On en déduit que la probabilité que la fréquence soit hors de l intervalle I est environ égale à 0,038. Commentaires : On voit que cette probabilité est inférieure à 5 % ce qui est bien conforme à la définition de l intervalle de fluctuation à 95 %. X 17 = (X < 17) = (X 16) X prend les valeurs de 0 à 16 D après la table des probabilités cumulées, on lit : a = 6 et b = 19.
X 17 = (X 17) X prend les valeurs de 0 à 17 5 1 ) a ) X suit la loi binomiale B (48 ; 0,16). b) Pour déterminer l intervalle de fluctuation au seuil de 95 %, on utilise le tableau des probabilités cumulées croissantes. k P (X k) 53 0,015 54 0,098 55 0,0406 56 0,0543 6 Parité homme-femme Guide de résolution : Remarques : calculs inutiles ) a) f = 0,0093 b) 54 48 0,16168 84 48 0,196 1 ) En utilisant la calculatrice ou un tableur (feuille de calcul), on affiche les valeurs des probabilités P(X k) lorsque X suit la loi binomiale de paramètres : n = 100, p = 0,5 n = 00, p = 0,5 83 0,9739 84 0,9806 85 0,9858 86 0,9897 54 84 L intervalle de fluctuation à 95 % de la fréquence est I = ; 48 48. ) a) 86 f 48 b) f I donc on rejette au risque de 5 % l information fournie par l entreprise. c) La probabilité de commettre une erreur lors de la prise de décision est : p = P (X 53) + P (X 85) p = P (X 53) + 1 P (X 84) p 0,015 + 1 0,9858 p 0,0409 Ceci permet de déterminer pour chacune des deux sociétés un intervalle de fluctuation au seuil de 90 %. ) La fréquence 0,43 appartient-elle aux deux intervalles de fluctuation? Solution détaillée : société A : 100 employés société B : 00 employés 1 ) Société A : X suit la loi binomiale B (100 ; 0,5). Pour déterminer l intervalle de fluctuation au seuil de 90 % *, on cherche : - le plus petit entier naturel a tel que P (X a) > 0,05 ; - le plus petit entier naturel b tel que P (X b) 0,95. * On veut un seuil de 90 % donc on répartit les 10 % restants en deux : 5 % de part et d autre d où 0,05 = 5 % et 0,95 = 100 % 5 %. Le risque de commettre une erreur est environ 4,09 % (donc bien inférieur à 5 %).
Pour obtenir sur calculatrice TI le tableau des probabilités cumulées croissantes de la loi binomiale B (100 ; 0,5), - on tape Y = binomfrep(100,0.5,x) (binomfrep s obtient dans Distrib) ; - on tape ensuite nde Trace afin d obtenir le tableau de valeurs (que l on s arrange pour avoir avec un pas de 1, de 0 à 100). On lit a = 4 et b = 58. k P (X k) 40 0,0844 41 0,04431 4 0,06661 43 0,09667 55 0,86437 56 0,90333 57 0,93339 58 0,95569 L intervalle de fluctuation de la fréquence d emploi des femmes au seuil de 90 % est 4 59 ; 100 100 = [0,4 ; 0,58]. Société B : Y suit la loi binomiale B (00 ; 0,5). Pour déterminer l intervalle de fluctuation au seuil de 90 %, on cherche : - le plus petit entier naturel a tel que P (Y a) > 0,05 ; - le plus petit entier naturel b tel que P (Y b) 0,95. On lit a = 88 et b = 11. k P (Y k) 86 0,0798 87 0,0384 88 0,0518 89 0,06868 109 0,9105 110 0,9313 111 0,94818 11 0,96158 L intervalle de fluctuation de la fréquence d emploi des femmes au seuil de 90 % est 88 11 ; 00 00 = [0,44 ; 0,66]. Conclusion : Dans l hypothèse où la parité est respectée, l intervalle de fluctuation de la fréquence d emploi des femmes au seuil de 90 % est de : 4 58 - société A : ; 100 100 = [0,4 ; 0,58]. 88 11 - société B : ; 00 00 = [0,44 ; 0,66]. ) Dans les deux entreprises la fréquence des femmes est de 43 %. La fréquence des femmes est donc de 0,43 dans les deux entreprises. 0,43 [0,4 ; 0,58] donc l hypothèse de parité ne peut être rejetée pour l entreprise A. 0,43 [0,44 ; 0,66] donc l hypothèse de parité peut être rejetée pour l entreprise B au seuil de risque de 90 %.
7 Guide de résolution : On cherche n * tel que n 5 10 (1). 1 ) Dans un tableau, on affiche les probabilités P(X k) lorsque X suit la 1oi binomiale de paramètres n et p = 0,. Pour chacune des valeurs de n envisagée, on détermine l'intervalle de fluctuation et son amplitude. ) Que peut-on dire des fluctuations d échantillonnage lorsque la taille de l échantillon augmente? 1 1 3 ) L intervalle de fluctuation est sensiblement le même que l intervalle p ; p n n. Solution détaillée : 1 billet sur 5 est gagnant f : fréquence des billets gagnants dans un échantillon aléatoire de n billets 1 ) On considère une variable aléatoire X qui suit la loi binomiale B(n ; 0,). Pour chaque ligne, on peut utiliser la calculatrice, un tableur ou directement le site de l académie de Versailles (mais qui ne fonctionne que lorsque n > 0). Taille de l échantillon Intervalle de fluctuation au seuil de 95 % Amplitude n = 0 [0,05 ; 0,4] (a = 1, b = 8) 0,3 n = 50 [0,1 ; 0,3] (a = 5 ; b = 16) 0, n = 100 [0,14 ; 0,8] (a = 1 ; b = 8) 0,14 n = 00 [0,145 ; 0,55] (a = 9 ; b = 51) 0,11 n = 500 [0,166 ; 0,36] (a = 83 ; b = 118) 0,07 ) Lorsque la taille de l échantillon augmente, la fluctuation d échantillonnage diminue donc l amplitude de l intervalle de fluctuation au seuil de 95 % diminue. 3 ) Déterminons la taille de l'échantillon pour que l amplitude de l intervalle de fluctuation soit inférieure ou égale à 5 10. (1) 510 40 n 1600 n n Conclusion : Pour que l amplitude de l intervalle de fluctuation soit inférieure à 5 10, il faut et il suffit que la taille de l échantillon soit supérieure ou égale à 1600. 8 Naissances garçons-filles 105 G pour 100 F Dans une ville en 010 : 504 F ; 486 G 1 ) Probabilité de naissance d une fille On sait qu en France, 105 garçons et 100 filles naissent en moyenne. 100 100 0 Lors d une naissance en France, la probabilité p qu il s agisse d une fille est égale. 100 105 05 41 On n a pas intérêt à donner une valeur approchée de ce quotient. ) Loi suivie par X X suit la loi B (990 ; 0 41 ). a b 3 ) Intervalle de fluctuation de la fréquence au seuil de 95 % : intervalle de la forme ; 990 990 À l aide de la calculatrice ou d un tableur, on cherche : - le plus petit entier naturel a tel que P (X a) > 0,05 ; - le plus petit entier naturel b tel que P (X b) 0,975. On dresse un tableau des probabilités cumulées avec 3 valeurs à chaque fois. 1 1 Pour n 5, l intervalle de fluctuation est sensiblement le même que l intervalle p ; p n n. L amplitude de cet intervalle est donc 1 1 p p. n n n
k P (X k) 450 0,01955 451 0,78 k P (X k) 3 0,01664 4 0,085 45 0,645 41 0,9579 51 0,96997 513 0,97405 4 0,9789 43 0,98339 On lit a = 45 et b = 514. 514 0,97764 45 514 Un intervalle de fluctuation d échantillonnage de la fréquence au seuil de 95 % est donc I = ; 990 990 (valeurs approchées des bornes inutiles). 4 ) La fréquence de naissances de filles dans la maternité étudiée est de 504 990. On n a pas intérêt à simplifier ce résultat. 5 ) Cette fréquence appartient à l intervalle de fluctuation au seuil de 95 % ( 504 I) donc ce résultat n est 990 pas exceptionnel. 9 Romain : dé truqué qui lui permet d obtenir la face numérotée 6 en moyenne une fois sur trois Camille réalise n = 100 lancers et observe une fréquence d apparition du 6 égale à f = 0,3. Pour répondre, on doit utiliser la fluctuation d échantillonnage. On se fixe un seuil de 95 %. On va établir un test. On note X une variable aléatoire qui suit la loi binomiale B (100 ; 1 3 ). a = 4 et b = 43 Un intervalle de fluctuation au seuil de 95 % de la fréquence d apparition du 6 sous l hypothèse d un dé truqué 1 4 43 (hypothèse «p») est I = ; 3 100 100 = [0,4 ; 0,43]. 3 f 0,3 100 f I donc Camille peut rejeter l hypothèse de Romain avec un risque de 5 %. Toutes les valeurs de l intervalle I sont supérieures à f («f < I» : écriture incorrecte) ; par suite, Camille n admet pas après fluctuation d échantillonnage que le dé de Romain est truqué. 10 Urne contenant des jetons noirs ou blancs de composition inconnue Paul pense qu il y a 60 % de jetons blancs. Louise tire 100 jetons. 1 ) X : nombre de jetons blancs dans un échantillon de taille 100 dans l hypothèse où Paul a raison Si Paul a raison, la variable aléatoire X suit la loi binomiale B (100 ; 0,6). a b On cherche l intervalle de fluctuation ; 100 100 de la fréquence au seuil de 95 %. k P (X k) 48 0,01001 49 0,01676 50 0,071 68 0,96015 69 0,975
On trouve a = 50 et b = 69. 50 69 L intervalle de fluctuation au seuil de 95 % est I = ; 100 100. ) Règle de décision du cours 3 ) Louise a obtenu f = 0,51. On a donc f I et, par suite, l hypothèse de Paul ne peut pas être rejetée. 11 Défauts de fabrication 1 ) Algorithme de simulation : Variables : n, i, k : entiers naturels x, y, f : réels Entrée : Saisir n Initialisation : k prend la valeur 0 Traitement : Pour i allant de 1 à n Faire x prend la valeur d un réel aléatoire dans [0 ; 1[ y prend la valeur d un réel aléatoire dans [0 ; 1[ Si (x 0,1 ou y 0,) alors k prend la valeur k + 1 FinSi FinPour f prend la valeur k n Sortie : Afficher f a) Analyse des variables de cet algorithme : - n : nombre de tirages - i : variable de boucle Chaque valeur de i simule le tirage d un objet. - x : choix d un nombre aléatoire entre 0 et 1 (dans l intervalle [0 ; 1[) La valeur de x permet de détecter la présence ou non du défaut A. Si 0 x 0,1, alors l objet a le défaut A ; sinon, l objet n a pas le défaut A. - y : choix d un nombre aléatoire entre 0 et 1 (dans l intervalle [0 ; 1[) La valeur de y permet de détecter la présence ou non du défaut B. Si 0 y 0,, alors l objet a le défaut B ; sinon, l objet n a pas le défaut B. Les choix de x et de y sont indépendants, ce qui traduit l indépendance des défauts. - k : nombre d objets qui présentent au moins l un des deux défauts. - f : fréquence des objets qui présentent au moins l un des deux défauts À propos de la condition : «ou» ; «ou inclusif» Attention : le connecteur logique de la condition est bien «ou» et non «et». Le «ou» qui intervient ici est inclusif (c est-à-dire que c est le «ou» classique en logique mathématique. b) Programme correspondant à cet algorithme : Sur calculatrice TI, on rentre le programme suivant. Quelques commentaires sur ce programme : : PROMPT N : 0 K : For(I, 1, N) : NbrAléat X : NbrAléat Y : If X 0,1 ou Y 0, : K + 1 K : End : K/N F : Disp F On utilise le générateur de nombres pseudo-aléatoires de la calculatrice. Sur calculatrice TI, on va dans MATH puis va dans PRB. Puis on sélectionne 1 : NbrAléat. Cela correspond à la touche «random» des calculatrices de collège. Sur calculatrice TI, on trouve le «ou» (et le «et») en tapant nde math logique. Si la calculatrice est en anglais, le «ou» est remplacé par «or». En faisant tourner le programme, on obtient des échantillons de taille n = 1 000, n = 5 000, n = 10 000. Pour aller plus loin : On pourrait utiliser le «ouexcl» * de la calculatrice (calculatrices de modèles TI) qui correspond au «ou exclusif» c est-à-dire l un ou l autre mais pas les deux en même temps. Cela permettrait de simuler la présence d un seul défaut. En faisant tourner le programme, on constaterait que l on obtient un résultat proche de 0,6 (probabilité que l objet présente un seul défaut). * «xor» si la calculatrice est en anglais
c) Que remarque-t-on pour les fréquences affichées? On remarque que l on trouve chaque fois un résultat proche de 0,8. On ne peut pas justifier ce résultat en 1 ère (mais en Terminale, il sera possible de le faire). Bien évidemment, chaque élève trouve un résultat différent des autres et quand on fait tourner le programme plusieurs fois, on obtient des résultats différents. N.B. : Le programme est assez long pour n = 1 000, et encore plus pour n =10 000 (il faut attendre 0 minutes et même plus!). ) p = 0,8 (probabilité qu un produit présente l un au moins des deux défauts) On effectue un contrôle de 100 produits. a) Déterminons un intervalle de fluctuation au seuil de 90 % de la fréquence des produits qui présentent l'un au moins des deux défauts. À l aide de la calculatrice, on cherche : - le plus petit entier naturel a tel que P (X a) > 0,05 ; - le plus petit entier naturel b tel que P (X b) 0,95. On trouve : a = 1 et b = 35. 1 35 On peut donc donner un intervalle de fluctuation au seuil de 90 % : I = ; 100 100 soit I = [0,1 ; 0,35]. b) Le fabricant prétend que, sur un tel échantillon, moins de 0 % des produits présentent l un au moins des deux défauts. Que peut-on en penser? Si f < 0,, alors f I donc on rejette l hypothèse au risque de 10 % d erreur. 1 Sondage A pense gagner avec 60 % des voix Dans un sondage effectué auprès de 00 personnes, 104 personnes se déclarent en faveur de A. 1 ) En supposant que le sondage secret reflète fidèlement l opinion des électeurs le jour du débat, donnons l intervalle de fluctuation à 95 % de la fréquence des personnes favorables à A sur un échantillon aléatoire de 00 personnes. X suit la loi binomiale B (00 ; 0,6). (0,6 : probabilité qu un candidat vote pour A sous l hypothèse émise par A) On cherche les valeurs de a et b correspondant à un intervalle de fluctuation à 95 %. a = 108 et b = 133 108 133 L intervalle de fluctuation au seuil de 95 % est I = ; 00 00. ) Que peut-on dire à la suite du résultat du sondage commandé par B? f 104 00 On constate que f I (f est «inférieure» à l intervalle I). On rejette donc l affirmation de A au risque de 5 % d erreur. B réajuste à la baisse les prévisions de A (60 % d électeurs). Autre formulation : On peut rejeter l affirmation de A avec un risque de 5 % d erreur. 3 ) Reprenons les questions 1 ) et ) en fixant le seuil de l intervalle de fluctuation à 98 %. 104 136 L intervalle de fluctuation au seuil de 98 % est J = ; 00 00. On constate que f J donc on ne peut pas rejeter l hypothèse du candidat A au risque de % d erreur (on peut considérer que l hypothèse du candidat est recevable au seuil de 98 %). Le candidat A aurait prévu juste. 13 Discrimination On suppose que les 870 jurés sont tirés au sort dans la population du comté (la population étant très importante, on peut considérer qu il s agit de tirages avec remise). Sous cette hypothèse, la variable aléatoire X correspondant au nombre de jurés d origine mexicaine suit la loi binomiale de paramètres n = 870 et p = 0,8. On doit choisir un seuil. On va prendre le seuil de 95 % qui est le plus utilisé. On peut alors rechercher, en utilisant la loi binomiale, l intervalle de fluctuation au seuil de 95 % correspondant. Une tabulation de la loi binomiale de paramètres n = 870 et p = 0,8 fournit les résultats suivants : k P(X k) 67 0,045 673 0,096 718 0,9733 719 0,9783 Comme 870 est un nombre assez grand, la recherche sur calculatrice est un peu fastidieuse. On peut, si on le veut, utiliser un tableur.
L intervalle de fluctuation au seuil de 95 % de la fréquence des jurés d origine mexicaine est : I = [ 673 870 ; 719 870 ]. La fréquence observée est f = 339 870. Règle de décision : Si f I, alors on ne peut pas rejeter l'hypothèse selon laquelle le pourcentage de pièces avec défaut est de 5 %. Si f I, alors on rejette cette hypothèse au risque d'erreur de 5 %. Cette valeur ne se situe pas dans l intervalle de fluctuation. La différence est significative au seuil de 95 % et l hypothèse p = 0,8, avec un tirage aléatoire des jurés, est rejetée. De fait, l accusé a obtenu gain de cause et a été rejugé par un autre jury. 95 % 5 % Autre formulation : On peut donc dire que les Américains d origine mexicaine sont sous-représentés car f I. 0 304 1 Le recours aux valeurs approchées n est pas du tout utile. Voici cependant le détail de la méthode utilisant des valeurs approchées : On calcule les fréquences 673 719 0,774 et 870 870 0,86. L intervalle de fluctuation au seuil de 95 % de la fréquence des jurés d origine mexicaine est : [0,774 ; 0,86]. La fréquence observée est f = 339 870 0,39. 14 1 ) Loi suivie par X La proportion des pièces ayant un défaut est égale à 0,05. X suit la loi B (304 ; 0,05). La visualisation de cette loi fait apparaître une dissymétrie du diagramme en bâtons. ) Déterminons le plus petit entier naturel a tel que P (X a) > 0,95. On trouve a =. 3 ) L intervalle I = 0 ; 304 est un intervalle de fluctuation à 95 %. On peut construire le test suivant qui, à partir de la fréquence f, observée dans un échantillon de taille 304, permet de dire si l on doit rejeter l hypothèse selon laquelle le pourcentage de pièces avec défaut est de 5 %. Zone de rejet 4 ) Comme il y a 18 pièces présentant un défaut sur 304 pièces, on a une fréquence de pièces présentant un 18 défaut égale à : f. 304 f I donc on ne rejette pas l hypothèse (on ne dit pas que l hypothèse est validée). 15 Rejet unilatéral 1 ) X suit la loi B (100 ; 0,5). ) Déterminons le plus petit entier naturel a tel que P (X a) > 0,95. Avec la calculatrice, on trouve a = 58. 3 ) Déterminons un intervalle de fluctuation à 95 %. 58 L intervalle I = 0 ; 100 est un intervalle de fluctuation à 95 %. Il s agit d un intervalle unilatéral. Le choix d un intervalle unilatéral dans ce cas n apparaît pas clairement lorsque l on observe le diagramme en bâtons de la loi binomiale B (100 ; 0,5). Ce choix - dicté par l énoncé - vient plutôt du choix de l hypothèse alternative p > 1. Règle de décision : On note f la fréquence observée dans l échantillon.
Si f I, alors on ne peut pas rejeter l hypothèse selon laquelle le magicien est un imposteur. Si f I, alors on rejette cette hypothèse au risque d erreur de 5 %. Commentaire : Le recours à un intervalle unilatéral - imposé par l énoncé - n est pas du tout obligatoire. On pourrait tout aussi bien utiliser l intervalle classique bilatéral. 4 ) La fréquence observée est f 64. 100 f I donc on rejette l hypothèse selon laquelle le magicien est un imposteur. 16 QCM 1 ) a) Loi suivie par X Le candidat répond au hasard donc pour chaque question, il a 1 chance sur 3 de donner la bonne réponse. X suit la loi B (0 ; 1 3 ). b) Espérance de X D après la formule donnant l espérance d une variable aléatoire qui suit la loi binomiale, E(X) = 0 1 0 3 3 On laisse la valeur exacte en fraction ; il n est pas utile de donner une valeur approchée. Rappel : Si X est une variable aléatoire qui suit la loi B (n ; p), alors l espérance de X est donnée par : E(X) = n p. ) a) k P(X k) 4 0 3 10 1 0,00331 0,01759 3 0,06045 4 0,15151 5 0,971 6 0,47934 7 0,066147 8 0,80945 9 0,9081 10 0,9636 11 0,98703 1 0,9968 13 0,9991 14 0,99983 15 0,99997 16 1 * 17 1 18 1 19 1 0 1 * Il s agit bien évidemment de valeurs approchées. b) Calcul de P (X < 11) et de P (X 11) P (X < 11) = P (X 10) donc P (X < 11) 0,9636
P (X 11) = 1 P (X < 11) = 1 P (X 10) P (X 11) 1 0,96 P (X 11) 0,04 1 ) Quelle loi de probabilité que suit X? Donner E(X). X suit la loi binomiale de paramètres n et p = S (valeur inconnue). E (X) = n S ) En déduire qu on peut obtenir une valeur approchée de S par cette méthode. c) Environ 4 % des personnes répondant au hasard auront au moins 11 bonnes réponses. Donc on fixe : n = 11. E X n X = S ou E n = S 3 ) a) Y suit la loi binomiale B (0 ; 0,6). b) D après la calculatrice, P (Y 10) 0,4466796 Le candidat a environ une chance sur 4 d être recalé. 17 La méthode de Monte-Carlo S : aire du domaine D compris entre la courbe représentative de la fonction «carré», l axe des abscisses et la droite d équation x = 1. La fréquence du nombre de points qui tombent dans le domaine D est une valeur approchée de l aire S et cette valeur sera d autant meilleure que n est grand. 3 ) Élaborer un algorithme qui simule n lancers d'un point sur le carré, et qui calcule en sortie une valeur approchée de S. On rédige un algorithme comprenant une boucle «Pour» et une instruction conditionnelle. Cette instruction conditionnelle est basée sur la condition nécessaire et suffisante suivante pour qu un point M(x, y) tel que 0 x 1 et 0 y 1 appartienne au domaine D : Pour cela, on place un point au hasard, sur le carré OABC, puis on répète cette expérience aléatoire n fois de façon indépendante. On appelle X la variable aléatoire égale au nombre de points qui sont dans le domaine D. On admet que la probabilité qu un point tombe dans D est égale au rapport des aires de D et du carré, soit S. On veut calculer par une méthode probabiliste l'aire S du domaine plan D compris entre la courbe représentative C de la fonction «carré», l axe des abscisses et la droite d équation x = 1. On peut alors rédiger l algorithme suivant : M D y x C j C B Variables : n, i, N : entiers naturels x, y, f : réels Entrée : Saisir n Initialisation : N prend la valeur 0 O On appelle X la variable aléatoire égale au nombre de points qui sont dans le domaine D. On admet que la probabilité qu'un point tombe dans D est égale au rapport des aires de D et du carré, soit S. i A Traitement : Pour i allant de 1 à n Faire x prend la valeur d un réel aléatoire dans [0 ; 1[ y prend la valeur d un réel aléatoire dans [0 ; 1[ Si y x alors N prend la valeur N + 1 FinSi FinPour f prend la valeur N n Sortie : Afficher f
On observera le «changement de cadre» (selon l expression de la didacticienne Régine Douady) original effectué dans cette méthode. Avec cette méthode, on peut déterminer des valeurs approchées de en remplaçant l arc de parabole par un arc de cercle (voir simulation sur le site de Thérèse Éveilleau). On observe que la convergence est assez lente (il faut de nombreux points pour obtenir la première décimale de et encore davantage pour la deuxième décimale). cadre géométrique cadre des probabilités Les méthodes de Monte-Carlo peuvent être reliées à l expérience de l aiguille de Buffon au XVIII e siècle : expérience très célèbre permettant de déterminer des valeurs approchées de. 4 ) Programme Pour programmer cet algorithme sur calculatrice : on doit changer les lettres en lettres majuscules ; du coup, on doit également changer le nom de certaines lettres. on utilise la commande spéciale permettant de tirer un nombre au hasard dans l intervalle [0 ; 1[ (générateur de nombres pseudo-aléatoires de la calculatrice). Sur la calculatrice TI, aller dans MATH puis choisir PRB et sélectionner 1 : NbreAléat (dans le programme on écrit : «NbreAléat x» ). Lorsque l on fait fonctionner le programme pour n = 100, puis pour n = 300, et pour d autres valeurs encore plus grandes, on obtient une valeur proche de 0,3. Lorsque l on programme cet algorithme, on obtient des valeurs approchées de S. Lorsque n devient de plus en plus grand, la fluctuation d échantillonnage diminue et les valeurs de f sont de plus en plus proches de S. On démontrera en Terminale à l aide des suites ou des intégrales que S est égale à 1 (en unité d aire, 3 cette unité d aire étant définie par le repère). Archimède connaissait déjà ce résultat dans l antiquité (méthode des triangles inscrits dans une parabole). Cet exercice se rattache à la partie «estimation» abordée en seconde avec la notion d intervalle de confiance. Il s agit de l estimation d une aire par la méthode de Monte-Carlo. Pour aller plus loin : réalisation du programme sur calculatrice pour la méthode de Monte-Carlo correspondant à un quart de cercle inscrit dans un carré. Variables : n, i, N : entiers naturels x, y, f : réels Entrée : Saisir n Initialisation : N prend la valeur 0 Traitement : Pour i allant de 1 à n Faire x prend la valeur d un réel aléatoire dans [0 ; 1[ y prend la valeur d un réel aléatoire dans [0 ; 1[ Si x y 1 alors N prend la valeur N + 1 FinSi FinPour f prend la valeur N n Sortie : Afficher f La méthode de Monte-Carlo est une application intéressante des probabilités dans un domaine où on ne les attendrait pas. La méthode de Monte-Carlo est intéressante pour déterminer une valeur approchée de l aire d un domaine que l on ne sait pas calculer de manière exacte. Il serait intéressant de connaître la vitesse de convergence de la méthode de Monte-Carlo. La valeur obtenue sera une valeur approchée de l aire S ; on ne peut évidemment pas savoir à quelle précision. Cela dit, en utilisant le cours de seconde, on pourrait utiliser la notion d intervalle de confiance pour donner un intervalle dans lequel l aire se situe. Les méthodes de Monte-Carlo ont pris une grande importance au XX e siècle avec le développement de l informatique.