Université de Franche-Comté - IREM. Un exemple de calcul de risques de première et de seconde espèces Séminaire IREM - Yves DUCEL - 21 juin 2013

Documents pareils
Estimation: intervalle de fluctuation et de confiance. Mars IREM: groupe Proba-Stat. Fluctuation. Confiance. dans les programmes comparaison

Loi binomiale Lois normales

Probabilités et Statistiques. Feuille 2 : variables aléatoires discrètes

Indépendance Probabilité conditionnelle. Chapitre 3 Événements indépendants et Probabilités conditionnelles

Probabilités. C. Charignon. I Cours 3

TSTI 2D CH X : Exemples de lois à densité 1

Probabilité. Table des matières. 1 Loi de probabilité Conditions préalables Définitions Loi équirépartie...

LEÇON N 7 : Schéma de Bernoulli et loi binomiale. Exemples.

Calcul élémentaire des probabilités

Probabilités. I Petits rappels sur le vocabulaire des ensembles 2 I.1 Définitions... 2 I.2 Propriétés... 2

t 100. = 8 ; le pourcentage de réduction est : 8 % 1 t Le pourcentage d'évolution (appelé aussi taux d'évolution) est le nombre :

choisir H 1 quand H 0 est vraie - fausse alarme

Programmes des classes préparatoires aux Grandes Ecoles

Baccalauréat ES/L Amérique du Sud 21 novembre 2013

P1 : Corrigés des exercices

Baccalauréat ES Pondichéry 7 avril 2014 Corrigé

Probabilités sur un univers fini

TESTS D'HYPOTHESES Etude d'un exemple

Estimation et tests statistiques, TD 5. Solutions

Exercices types Algorithmique et simulation numérique Oral Mathématiques et algorithmique Banque PT

Commun à tous les candidats

Baccalauréat ES Polynésie (spécialité) 10 septembre 2014 Corrigé

Représentation d une distribution

Probabilités conditionnelles Loi binomiale

Baccalauréat ES Antilles Guyane 12 septembre 2014 Corrigé

Moments des variables aléatoires réelles

Probabilités. Rappel : trois exemples. Exemple 2 : On dispose d un dé truqué. On sait que : p(1) = p(2) =1/6 ; p(3) = 1/3 p(4) = p(5) =1/12

Chapitre 6. Fonction réelle d une variable réelle

Baccalauréat S Antilles-Guyane 11 septembre 2014 Corrigé

Coefficients binomiaux

Correction du Baccalauréat S Amérique du Nord mai 2007

Bac Blanc Terminale ES - Février 2011 Épreuve de Mathématiques (durée 3 heures)

Distribution Uniforme Probabilité de Laplace Dénombrements Les Paris. Chapitre 2 Le calcul des probabilités

Probabilités conditionnelles Exercices corrigés

3 Approximation de solutions d équations

Continuité et dérivabilité d une fonction

Précision d un résultat et calculs d incertitudes

Université Paris-Dauphine DUMI2E 1ère année, Applications

I. Introduction. 1. Objectifs. 2. Les options. a. Présentation du problème.

La mesure de Lebesgue sur la droite réelle

Bien lire l énoncé 2 fois avant de continuer - Méthodes et/ou Explications Réponses. Antécédents d un nombre par une fonction

Continuité en un point

GEA II Introduction aux probabilités Poly. de révision. Lionel Darondeau

Introduction au Calcul des Probabilités

Calculs de probabilités conditionelles

Probabilités sur un univers fini

Intégration et probabilités TD1 Espaces mesurés Corrigé

Simulation de variables aléatoires

Corrigé du baccalauréat S Pondichéry 12 avril 2007

La fonction exponentielle

4 Distributions particulières de probabilités

Le modèle de Black et Scholes

Exercices - Polynômes : corrigé. Opérations sur les polynômes

Texte Agrégation limitée par diffusion interne

Analyse stochastique de la CRM à ordre partiel dans le cadre des essais cliniques de phase I

Calculs de probabilités

Chapitre 3. Quelques fonctions usuelles. 1 Fonctions logarithme et exponentielle. 1.1 La fonction logarithme

Introduction à l étude des Corps Finis

Exo7. Probabilité conditionnelle. Exercices : Martine Quinio

FORMULAIRE DE STATISTIQUES

Chapitre 7. Statistique des échantillons gaussiens. 7.1 Projection de vecteurs gaussiens

Correction du baccalauréat ES/L Métropole 20 juin 2014

Baccalauréat L spécialité, Métropole et Réunion, 19 juin 2009 Corrigé.

Objectifs du cours d aujourd hui. Informatique II : Cours d introduction à l informatique et à la programmation objet. Complexité d un problème (2)

Calculs de probabilités avec la loi normale

LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING»

Lois de probabilité. Anita Burgun

Calcul matriciel. Définition 1 Une matrice de format (m,n) est un tableau rectangulaire de mn éléments, rangés en m lignes et n colonnes.

CHAPITRE 1. Suites arithmetiques et géometriques. Rappel 1. On appelle suite réelle une application de

Complément d information concernant la fiche de concordance

Rappels sur les suites - Algorithme

Fonctions de plusieurs variables

Suites numériques 3. 1 Convergence et limite d une suite

Corrigé des TD 1 à 5

CALCUL DES PROBABILITES

Programmation linéaire

Chapitre 3. Les distributions à deux variables

PROBABILITES ET STATISTIQUE I&II

Chapitre 2 Le problème de l unicité des solutions

INTRODUCTION À L ANALYSE FACTORIELLE DES CORRESPONDANCES

* très facile ** facile *** difficulté moyenne **** difficile ***** très difficile I : Incontournable T : pour travailler et mémoriser le cours

Baccalauréat ES/L Métropole La Réunion 13 septembre 2013 Corrigé

Quantification Scalaire et Prédictive

Théorie de la Mesure et Intégration

ÉVALUATION FORMATIVE. On considère le circuit électrique RC représenté ci-dessous où R et C sont des constantes strictement positives.

Statistiques Décisionnelles L3 Sciences Economiques & Gestion Faculté d économie, gestion & AES Université Montesquieu - Bordeaux

Intégration et probabilités TD1 Espaces mesurés

Ressources pour le lycée général et technologique

Les devoirs en Première STMG

L exclusion mutuelle distribuée

Souad EL Bernoussi. Groupe d Analyse Numérique et Optimisation Rabat http ://

Annexe commune aux séries ES, L et S : boîtes et quantiles

Exercices sur le chapitre «Probabilités»

I. Polynômes de Tchebychev

FIMA, 7 juillet 2005

Raisonnement probabiliste

Master IMEA 1 Calcul Stochastique et Finance Feuille de T.D. n o 1

Espérance conditionnelle

Fonctions de plusieurs variables, intégrales multiples, et intégrales dépendant d un paramètre

Cours Fonctions de deux variables

Transcription:

Université de Franche-Comté - IREM Un exemple de calcul de risques de première et de seconde espèces Séminaire IREM - Yves DUCEL - 21 juin 2013 1 L expérience de la pièce de Buffon Illustrons cette démarche en l appliquant à une expérience que Buffon relate dans son Essai d arithmétique morale (1777) : Buffon fait lancer à un enfant 4040 fois une pièce de monnaie. Il obtient 2 048 fois "Pile". La question est de savoir si la pièce utilisée était équilibrée, c est-à-dire si la probabilité d obtenir "pile" avec cette pièce est égale à 0, 5. 2 Le modèle statistique de Bernoulli On considère E l ensemble d un très très grand nombre de lancers (comprenant aussi les lancers effectués par Buffon) qu on peut faire avec la pièce de Buffon. On considère comme événements intéressants toutes les parties de E : la tribu des événements est donc P(E) l ensemble des parties de E. On considère alors l équiprobabilité Q sur E, c est-à-dire l application : Q : A P(E) Q(A) = card(a) card(e). On a ainsi défini un espace de probabilité (E, P(E), Q) modélisant l expérience aléatoire qui consiste à lancer 1 fois la pièce de Buffon. On considère, pour chaque réel p ]0, 1[, la variable aléatoire de Bernoulli ε p définie par : { 1 si le lancer e donne "pile" ε p : e E ε p (e) = 0 si le lancer e donne "face" Pour chaque réel p, la variable de Bernoulli ε p est de paramètre p, c est-à-dire que Q(ε p = 1) = p. La valeur de p est déterminée par "l état de la nature" (qu on ne connaît pas), aussi on prend le partie de les considérer a priori toutes dans les raisonnements. Par suite, travailler, par exemple, avec la variable ε 0,3 dans les calculs, signifie qu on considère que 0, 3 est la "vraie" valeur de la probabilité d obtenir "pile" avec la pièce de Buffon. On dit aussi que l état de la nature pour la probabilité d obtenir "pile" avec la pièce de Buffon est p = 0, 3. 1

Remarque : Modèle statistique canonique : On pourrait proposer un autre modèle de la situation, qu on appelle modèle canonique, en posant Ẽ = {0, 1}. On considère comme événements intéressants toutes les parties de Ẽ : la tribu des événements est donc P(Ẽ) = {, E, {0}, {1}} l ensemble des parties de Ẽ. Pour tout réel p ]0 1[, on considère alors la probabilité Q p sur Ẽ telle que Q p({1}) = p, c est-à-dire l application : Q p : A P(Ẽ) Q p(a) = p1l A (1) + (1 p)1l A (0). On a ainsi défini un espace de probabilité (Ẽ, P(Ẽ), Q p) modélisant l expérience aléatoire qui consiste s intéresser au résultat "pile" ou "face" quand on lance 1 fois la pièce de Buffon. On considère alors, pour chaque réel p ]0, 1[, la variable aléatoire identité ε = Id E définie par : ε : e Ẽ ε(e) = { 1 si e = 1 0 si e = 0 Pour chaque réel p, la variable aléatoire identité ε est une variable aléatoire de Bernoulli de paramètre p définie sur l espace de probabilité (Ẽ, P(Ẽ), Q p), car Q p ( ε = 1) = p. La valeur de p est déterminée par "l état de la nature" (qu on ne connaît pas), aussi on prend le partie de les considérer a priori toutes dans les raisonnements. 3 Le modèle d échantillonnage de Bernoulli de taille n Pour décider sur l équilibre de la pièce, on fait une observation de 4040 lancers et on regarde pour chacun des 4040 lancers si on a "pile" ou si on a "face" (Dans la suite pour simplifier, sauf avis contraire, on écrira n dans les relations au lieu de 4040). S intéresser à n lancers à l identique de la pièce de Buffon revient à introduire une autre expérience aléatoire dont les issues sont des suites de n lancers de la pièce, c est-à-dire des suites à n termes d éléments de l ensemble E. On introduit donc l ensemble Ω = E n de toutes les suites d éléments de E à n termes i.e. l ensemble des suites ω = (e k ) 1 k n où, pour tout k = 1, 2,..., n, e k E. On considère comme événements intéressants, toutes les parties de Ω : la tribu des événements est donc P(Ω) l ensemble des parties de Ω = E n. On considère alors l équiprobabilité P sur E n, c est-à-dire l application : P : B P(Ω) P(B) = card(b) card(ω). Dans le cas où l événement B s écrit B = A 1 A 2... A n Ω avec les facteurs A i qui sont des parties quelconques de E, cette probabilité vérifie la relation remarquable suivante, P(B) = P(A 1 A 2... A n ) = Q(A 1 ) Q(A 2 )... Q(A n ). On dit que P est le produit des n probabilités Q (avec n facteurs), on écrit pour cela P = Q n. 2

On a ainsi défini un espace de probabilité (Ω, P(Ω), P) modélisant l expérience aléatoire qui consiste à effectuer à l identique n fois le lancer de la pièce de Buffon. On considère, pour chaque réel p ]0, 1[ et pour chaque i = 1, 2,..., n, la variable aléatoire X i (dépendant de p) définie par : { 1 si le lancer numéro i de ω donne "pile" X i : ω = (e k ) 1 k n Ω X i (ω) = ε p (e i ) = 0 si le lancer numéro i de ω donne "face" Pour p fixé, on a P(X i = 1) = P(E E... {ε p = 1} E... E) = Q(ε p = 1) = p. Pour tout i, la variable aléatoire X i est donc une variable de Bernoulli de paramètre p. La définition de la probabilité P implique que la suite de variables aléatoires (X 1, X 2,..., X n ) est indépendante. On introduit ainsi, pour tout réel p, une suite de n variables aléatoires de Bernoulli (X 1, X 2,..., X n ) indépendantes, de même paramètre p (i.e. de même loi que la variable aléatoire ε p ) définies sur le même espace de probabilité (Ω, P(Ω), P). On traduit cela en disant que la suite (X 1, X 2,..., X n ) constitue un échantillon aléatoire de taille n de variable aléatoire parente ε p. Dans la suite de l exposé, nous aurons besoin des statistiques suivantes définies, pour chaque valeur de p, à partir de l échantillon (X 1, X 2,..., X n ). Il s agit des statistiques : 1) l effectif empirique S n,p = X 1 +X 2 +...+X n qui représente le nombre de "pile" obtenus dans n lancers de la pièce de Buffon. 2) la fréquence empirique F n,p = X 1 + X 2 +... + X n n "pile" obtenus dans n lancers de la pièce de Buffon. qui représente la proportion de 3) la fréquence empirique standardisée Z n,p = S p np np(1 p) = la variable aléatoire standardisée des statistiques F n,p et S n,p. F p p p(1 p) n qui représente Remarquons que, dans le modèle d échantillonnage de Bernoulli, la fréquence empirique n est rien d autre que la moyenne empirique de l échantillon (X 1, X 2,..., X n ). On possède des informations sur les lois de ces statistiques. On sait que : 1) pour tout p ]0, 1[ et tout entier naturel n 1), la variable aléatoire S n,p suit exactement la loi binomiale B(n, p) ; 2) pour tout p ]0, 1[, la loi de la variable aléatoire Z n,p converge, lorsque n tend vers l infini, vers la loi normale centrée-réduite (théorème de De Moivre-Laplace). Ce qui entraîne que lorsque p est voisin de 1/2, compte tenu que n = 4040 est très grand, on peut utiliser les approximations suivantes de lois : a. la loi de la variable aléatoire Z n,p est approximativement la loi normale centréeréduite ; b. la loi de la variable aléatoire F n,p est approximativement la loi normale d espérance p(1 p) p et de variance ; n 3

c. la loi de la variable aléatoire S n,p est approximativement la loi normale d espérance np et de variance np(1 p). Par la suite par souci de simplifier les écritures, comme n = 4040 est fixé et que c est le paramètre réel p qui sera variable, on ne mentionnera plus le n en indice, et on notera simplement Z p pour Z n,p, S p pour S n,p et F p pour F n,p. Remarque : Modèle d échantillonnage canonique : On introduit donc l ensemble Ω = Ẽn de toutes les suites d éléments de Ẽ à n termes i.e. l ensemble des suites ω = (e k) 1 k n où, pour tout k = 1, 2,..., n, e k Ẽ = {0, 1}. On considère comme événements intéressants, toutes les parties de Ω : la tribu des événements est donc P(Ω) l ensemble des parties de Ω = Ẽn. On montre alors que, pour tout réel p ]0, 1[, il existe une unique probabilité P sur Ẽn telle que, pour tout événement B de la forme B = A 1 A 2... A n Ω avec les facteurs A i qui sont des parties quelconques de Ẽ, la probabilité P vérifie la relation remarquable suivante, P(B) = P(A 1 A 2... A n ) = Q p (A 1 ) Q p (A 2 )... Q p (A n ). On dit que P est le produit des n probabilités Q p (avec n facteurs), on écrit pour cela P = Q n p. On a ainsi défini un espace de probabilité (Ω, P(Ω), P) modélisant l expérience aléatoire qui consiste à effectuer à l identique n fois le lancer de la pièce de Buffon et à noter si on obtient "pile" ou si on obtient "face". On considère alors, t pour chaque i = 1, 2,..., n, la variable aléatoire X i (non fonction de p) définie par : { 1 si le lancer numéro i de ω donne "pile" X i : ω = (e k ) 1 k n Ω X i (ω) = ε(e i ) = 0 si le lancer numéro i de ω donne "face" Pour p fixé, on a P(X i = 1) = P(Ẽ Ẽ... { ε = 1} Ẽ... Ẽ) = Q p( ε = 1) = p. Pour tout i, la variable aléatoire X i est donc une variable de Bernoulli de paramètre p. La définition de la probabilité P implique que la suite de variables aléatoires (X 1, X 2,..., X n ) est indépendante. On introduit ainsi, pour tout réel p, une suite de n variables aléatoires de Bernoulli (X 1, X 2,..., X n ) indépendantes, de même paramètre p (i.e. de même loi que la variable aléatoire ε) définies sur le même espace de probabilité (Ω, P(Ω), P). On traduit cela en disant que la suite (X 1, X 2,..., X n ) constitue un échantillon aléatoire de taille n de variable aléatoire parente ε. La suite est inchangée dans l utilisation de ces modèles 4

4 La prise de décision Décider si la pièce de Buffon est équilibrée, revient à tester l hypothèse nulle p = 0, 5 contre l hypothèse alternative p 0, 5, ce qu on écrira en posant p 0 = 0, 5 : H 0 ) p = p 0 H 1 ) p p 0 Pour trancher entre ces deux hypothèses, on va utiliser la démarche de prise de décision vue au lycée qui fait intervenir la notion d intervalle de fluctuation. On a le choix entre les trois définitions au programme du lycée, qu on peut utiliser en fonction des conditions de réalisation de l observation de l échantillon prélevé. Nous allons raisonner avec des IF définis avec un seuil de confiance de 95%, ce qu on exprimera aussi en disant que le seuil de signification de la prise de décision est égal à 5%. On applique alors la règle de décision suivante qui fait intervenir un intervalle de fluctuation IF (p 0 ) calculé avec la valeur p 0 = 0, 5 et n = 4040 : Rappelons la règle de décision avec la fréquence : Pour décider si p = 0, 5, on observe un échantillon de taille n et on détermine la fréquence observée f de "pile" dans cet échantillon : si f IF (p 0 ), on décide que p = p 0 ; si f IF (p 0 ), on décide que p p 0. Compte tenu des valeurs de n = 4040 et de p 0 = 0, 5, on pourra utiliser les IF de Seconde, de Première ou de Terminale. Voici les expressions et les valeurs correspondante à la prise de décision qui nous intéresse ici, pour les variables de décision S p et F p, de ces trois IF : Classe Variable Expression de l IF IF (fréquence) IF (effectif) [ ] Seconde fréquence p 0 1 n, p 0 1 n [0, 4842, 0, 5158] [1957, 2083] Première effectif [ [a, b] [0, 4847, 0, 5154] [1958, 2082] ] p0 (1 p 0 ) p0 (1 p 0 ) Terminale fréquence p 0 1, 96 n, p 0 + 1, 96 n [0, 4845, 0, 5155] [1958, 2082] 4.1 Décision avec l IF de Terminale L IF asymptotique de Terminale est déterminé en prenant pour valeur de la proportion p, la valeur p 0 figurant dans l hypothèse nulle p = p 0. Si on raisonne avec un seuil de signification [ α = 5%, on sait que l IF ] est donné par la formule suivante, où u α 1, 96, p0 (1 p 0 ) p0 (1 p 0 ) IF = p 0 u α n, p 0 + u α n d où. IF = [ 0, 5 1, 96 ] 0, 5(1 0, 5) 0, 5(1 0, 5), 0, 5 + 1, 96 [0, 4845, 0, 5155] 4040 4040 La variable de décision est ici la fréquence empirique F p0 dont on sait que sa loi est approximativement la loi normale d espérance p 0 et de variance p 0(1 p 0 ), avec p 0 = 0, 5 et n = 4040. n 5

L application de la règle de décision conduit à vérifier si la fréquence observée, ici f 0, 5069, 0,0140 appartient à l intervalle [0, 4845, 0, 5155] ; ce qui est le cas ici. On décide donc que p = 0, 5, c està-dire qu on considérera la pièce de Buffon équilibrée. 0,0120 0,0100,... /, 0,0080,... /, 0,0060 Probabilité ~ 0,025 0,0040 Probabilité ~ 0,025 0,0020 0,0000 On décide que la pièce n est pas équilibrée p 0,5 On décide que la pièce est équilibrée (intervalle de fluctuation) p = 0,5 On décide que la pièce n est pas équilibrée p 0,5 Règle de décision pour l IF-Terminale au seuil de signification 5% 4.2 Décision avec l IF de Seconde Nous aurions pu effectuer cette prise de décision en raisonnant avec l IF de Seconde, ce qui est possible car les conditions de validité n = 4040 > 30 et 0, 2 < p 0 = 0, 5 < 0, 8 sont bien vérifiées. La variable de décision est ici la fréquence empirique F 0,5. L application de la règle de décision conduit à déterminer l IF-Seconde [ p 0 1, p 0 + 1 ] [ 0, 5 1/ 4040 ; 0, 5 + 1/ ] 4040 = [0, 4842 ; 0, 5158], n n et à vérifier si la fréquence observée, ici f 0, 5069, appartient à cet intervalle ; ce qui est le cas ici. On décide donc que p = 0, 5, c est-à-dire qu on considérera la pièce de Buffon équilibrée. 6

0,0140 0,0120 0,0100 0,0080, /,, /, 0,0060 Probabilité 0,025 0,0040 Probabilité 0,025 0,0020 0,0000 On décide que la pièce n est pas équilibrée p 0,5 On décide que la pièce est équilibrée (intervalle de fluctuation) p = 0,5 On décide que la pièce n est pas équilibrée p 0,5 Règle de décision pour l IF-Seconde au seuil de signification 5% 4.3 Décision avec l IF de Première Si nous souhaitons raisonner avec la prise de décision utilisant l intervalle de fluctuation de Première, il est plus judicieux de raisonner avec la variable S p = nf p qui représente le nombre de "pile" dans n = 4040 lancers de la pièce de Buffon. On sait, d après le programme de Première, que cette variable aléatoire suit la loi binomiale de paramètre n = 4040 et de proportion p, où p désigne la probabilité (inconnue) d avoir "pile" avec cette pièce. Dans le cas de la prise de décision avec l IF de Première, nous n avons aucune condition de validité à vérifier portant sur n et p. Nous prendrons comme variable de décision la variable X p0 de loi binomiale de paramètre n = 4040 et de proportion p 0 = 0, 5. L intervalle de fluctuation de Première est alors déterminé en déterminant le plus grand entier a tel que P(S p0 < a) 0, 5 et le plus petit entier b tel que P(S p0 > a) 0, 5. En utilisant un tableur et sa fonction LOIBINOMIALE, on trouve que a = 1958 et b = 2082. Comme le nombre de "pile" observé dans les n lancers de Buffon est égal à 2048 qui appartient à l intervalle de fluctuation exact [1958 ; 2082], on décide donc que p = 0, 5, c est-à-dire qu on considérera la pièce de Buffon équilibrée. 7

0,0140 0,0120 0,0100 /, /, 0,0080 0,0060 Probabilité 0,025 0,0040 Probabilité 0,025 0,0020 0,0000 On décide que la pièce n est pas équilibrée p 0,5 On décide que la pièce est équilibrée (intervalle de fluctuation) p = 0,5 On décide que la pièce n est pas équilibrée p 0,5 Règle de décision pour l IF-Première au seuil de signification 5% 5 Les risques de première et de seconde espèces Rappelons le tableau des différents cas de figure susceptibles de se présenter dans une prise de décision entre deux hypothèses : On décide p = 0, 5 On décide p 0, 5 La pièce est réellement équilibrée Bonne décision Erreur I La pièce est réellement déséquilibrée Erreur II Bonne décision Le risque de première espèce, noté α, est la probabilité de l erreur I, c est-à-dire la probabilité de prendre la décision p p 0 alors qu en réalité p = p 0. Le risque de seconde espèce est la probabilité de l erreur II, c est-à-dire la probabilité, notée β(p 1 ), de prendre la décision p = p 0 alors qu en réalité p p 0, avec p = p 1, où p 1 est une certaine valeur différente de p 0. Le calcul de ce risque nécessite d avoir des informations sur l hypothèse alternative plus précises que p p 0. Dans la négative, on peut alors faire le calcul de β(p) pour toute valeur de p ]0, 1[\{p 0 }. 5.1 Calculs avec l IF de Terminale Le risque de première espèce est donc P(F 0,5 [0, 4845, 0, 5155]) = P(S 0,5 [1958, 2082]) = P(S 0,5 < 1958) + P(S 0,5 > 2082), où les calculs de probabilité sont conduits sous l hypothèse que la pièce est bien équilibrée, ce qui revient à considérer que le nombre de "pile" dans n lancers est exactement une variable binomiale de paramètre n = 4040 et de proportion p 0 = 0, 5, autrement dit à utiliser dans les 8

calculs la variable aléatoire S 0,5. La lecture de la loi binomiale de paramètre n = 4040 et de proportion 0, 5 à l aide d un tableur permet d obtenir le risque de première espèce α = P(S 0,5 [1958, 2082]) = P(S 0,5 < 1958)+(1 P(S 0,5 2082) = 0, 0246+(1 0, 9754) = 0, 0492 soit 4, 92%. Ici le risque de première espèce α est proche du seuil de signification de 5% fixé pour prendre la décision. On sait par définition de l intervalle de fluctuation asymptotique que P(F [0, 4845, 0, 5155]) 0, 95 et par suite que le risque de première espèce est α = P(F [0, 4845, 0, 5155]) = 1 P(F [0, 4845, 0, 5155]) 0, 05. Dans cette prise de décision, le risque de première espèce α est asymptotiquement égal au seuil de signification de 5% fixé pour prendre la décision. FAIRE DESSIN DU RISQUE DE PREMIERE ESPECE Le risque de seconde espèce revient à considérer ce qui se passe quand la pièce, en réalité, n est pas équilibrée c est-à-dire quand l hypothèse alternative est en réalité vérifiée (mais on ne le sait jamais). Pour faire le calcul du risque de deuxième espèce il est donc nécessaire de faire des hypothèses sur l éventuel déséquilibre de la pièce. Par exemple on va supposer qu en réalité la probabilité de tomber sur "pile", n est pas p 0 = 0, 5, mais plutôt p 1 = 0, 52. Dans ce cas là, on prendra une décision erronée si on décide que la pièce est équilibrée, c est-àdire si la fréquence observée dans l échantillon est dans l intervalle de fluctuation [0, 4845, 0, 5155] calculé avec p 0. Le risque de seconde espèce pour p 1 = 0, 52, qu on notera β(0, 52), est donc égal à la probabilité P(F 0,52 [0, 4845, 0, 5155]). On a alors β(0, 52) = P(F 0,52 [0, 4845, 0, 5155]) = P(S 0,52 [1958, 2082]). Soit β(0, 52) = P(S 0,52 2082) P(S 0,52 1957) = 0.2822 0 = 0, 2822. D où un risque de seconde espèce, de 28, 22%. Remarque : Un calcul avec l approximation normale de la loi de F 0,52 donnerait 28, 43% en introduisant la variable aléatoire Z 0,52 = qui est approximativement normale centréeréduite. F 0,52 0,52 0,52(1 0,52) 4040 FAIRE DESSIN DES RISQUES DE PREMIERE ESPECE ET DE SECONDE ESPECE sur le même graphique On pourrait faire le calcul du risque de seconde espèce pour d autres valeurs de p 1. Par exemple on va supposer qu en réalité la probabilité de tomber sur "pile", n est pas p 0 = 0, 5, mais plutôt p 1 = 0, 51, c est-à-dire calculer β(0, 51). Le risque de seconde espèce pour p 1 = 0, 51 est donc égal à la probabilité P(F 0,51 [0, 4845, 0, 5155]) alors que la fréquence empirique est calculée à partir d un échantillon de variable parente une variable de Bernoulli de paramètre p 1 = 0, 51. 9

En suivant la même démarche que précédemment, on aura alors, en introduisant cette fois-ci la variable aléatoire S 0,51 qui est une variable aléatoire binomiale de loi B(4040; 0, 51). On a alors β(0, 51) = P(F 0,51 [0, 4845, 0, 5155]) = P(S 0,51 [1958, 2082]). Soit β(0, 51) = P(S 0,51 2082) P(S 0,51 1957) = 0, 7566 0, 0006 = 0, 7560. D où un risque de seconde espèce, de 75.60%. Un calcul avec l approximation normale de la loi de F 0,51 donnerait 75, 73% en introduisant la variable aléatoire Z 0,51 = qui est approximativement normale centrée-réduite. F 0,51 0,51 0,51(1 0,51) 4040 Pour p 1 = 0, 53, on peut vérifier que le risque de seconde espèce β(0, 53) = P(S 0,53 2082) P(S 0,53 1957) = 0, 0322 0 = 0, 0322, soit 3, 22%. En résumé, avec la règle de décision que nous avons construite dans cette prise de décision sur l équilibre de la pièce de Buffon, nous avons 4, 92% (pratiquement 5%) de chances de décider que la pièce n est pas équilibrée alors qu en réalité elle l est (erreur de type I) et nous avons : 75, 60% de chances de décider que la pièce est équilibrée alors qu en réalité elle ne l est pas si la vraie valeur (inconnue) de la probabilité d obtenir "pile" en la lançant est p 1 = 0, 51 28, 22% de chances de décider que la pièce est équilibrée alors qu en réalité elle ne l est pas si la vraie valeur (inconnue) de la probabilité d obtenir "pile" en la lançant est p 1 = 0, 52 3, 22% de chances de décider que la pièce est équilibrée alors qu en réalité elle ne l est pas si la vraie valeur (inconnue) de la probabilité d obtenir "pile" en la lançant est p 1 = 0, 53 On remarque que, plus l écart entre p 0 et p 1 est important, plus le risque de seconde espèce est faible alors que, par construction, le risque de première espèce est constant et égal pratiquement à 5%. Par ailleurs, en réalité on ne connaît pas p 1, on peut alors tracer la courbe de l application p ]0, 1[\{p 0 } β(p) représentant l évolution de β(p) en fonction de p. On obtient une courbe dont l allure est la suivante : METTRE ICI COURBE DE BETA et ETA On peut donner une expression en fonction de p de β(p). En effet, en introduisant la variable aléatoire Z p = S p np qui est approximativement normale centrée-réduite, on peut écrire : np(1 p) β(p) = P(0, 4845 F p 0, 5155) = P(1958 S p 2082) = P ( 1958 np np(1 p) Z p ) 2082 np. np(1 p) Ce qu on peut écrire, en introduisant la fonction de répartition Φ de la loi normale centréeréduite, compte tenu que, lorsque par exemple p 0, 52, on a 1958 np < 0 et 2082 np < 0 ( ) ( ) 1958 4040p 2082 4040p β(p) = Φ Φ 4040p(1 p) 4040p(1 p) 10

où Φ(x) = 1 2π x centrée-réduite. e t2 /2 dt est la valeur en x de la fonction de répartition Φ de la loi normale 5.2 Calculs avec l IF de Seconde En gardant les même notations que ci-dessus, le raisonnement fait plus haut avec l intervalle de fluctuation de Terminale se conduit exactement de la même façon avec l IF de Seconde qui, calculé pour p 0 = 0, 5 vaut [0, 4842 ; 0, 5158]. Il suffit dans les calculs conduits plus haut de remplacer l intervalle [0, 4845, 0, 5155] par l intervalle [0, 4842, 0, 5158]. Le risque de première espèce est donc P(F 0,5 [0, 4842, 0, 5158]) = P(S 0,5 [1957, 2083]) = P(S 0,5 < 1957) + P(S 0,5 > 2083), où les calculs de probabilité sont conduits sous l hypothèse que la pièce est bien équilibrée, ce qui revient à considérer que le nombre de "pile" dans n lancers est exactement une variable binomiale de paramètre n = 4040 et de proportion p 0 = 0, 5, autrement dit à utiliser dans les calculs la variable aléatoire S 0,5. La lecture de la loi binomiale de paramètre n = 4040 et de proportion 0, 5 à l aide d un tableur permet d obtenir le risque de première espèce α = P(S 0,5 [1957, 2083]) = P(S 0,5 1956) + (1 P(S 0,5 2082) = 0, 0228 + (1 0, 9754) = 0, 0474, soit 4, 74%. D où un risque de première espèce α = P (F 0,5 [0, 4842, 0, 5158]) = 0, 0474, soit 4, 74%. On sait que pour l IF de Seconde, le risque de première espèce α n est pas asymptotiquement égal au seuil de signification de 5% fixé pour prendre la décision. Pour ce qui est du risque de seconde espèce, comme l IF de Seconde contient strictement celui de Terminale, cela signifie que, dans la prise de décision avec l IF de Seconde on aura tendance à accepter plus facilement l hypothèse p = p 0 que dans la prise de décision avec l IF de Terminale pour le même risque de première espèce α. On aura donc tendance refuser l hypothèse p p 0 plus facilement dans le cas de la prise de décision avec l IF de Seconde que dans celle avec l IF de Terminale. Ce qui veut dire qu on doit s attendre à avoir un risque de seconde espèce plus élevé avec l IF de Seconde qu avec l IF de Terminale. Ce qui peut justifier que dans ce cas, pour un même risque de première espèce, il vaut mieux utiliser l IF de Terminale que celui de Seconde. On dira que la prise de décision avec l IF de Terminale est plus puissante que celle avec l IF de Seconde. Plus précisément, la puissance d une prise de décision entre l hypothèse nulle p = p 0 et l hypothèse alternative p = p 1 est le réel, noté η(p 1 ) défini par η(p 1 ) = 1 β(p 1 ). Par exemple dans le cas du calcul du risque de seconde espèce avec l IF de Seconde pour p 1 = 0, 52, qu on notera β 2 (0, 52) pour le distinguer de celui calculé avec l IF de Terminale, on obtient : β 2 (0, 52) = P(F 0,52 [0, 4842, 0, 5158]) = P(S 0,52 [1957, 2083]). Soit β 2 (0, 52) = P(S 0,52 2083) P(S 0,52 1956) = 0, 2929 0 = 0, 2929. D où un risque de seconde espèce, de 29, 29%. Un calcul avec l approximation normale de la loi de F 0,52 donnerait 29, 81% en introduisant la variable aléatoire Z 0,52 = F 0,52 0,52 0,52(1 0,52) 4040 qui est approximativement normale centrée-réduite. 11

Soit un risque de seconde espèce, de 29, 29% au lieu de 28, 22%. La puissance de la prise de décision avec l IF de Seconde est donc η 2 (0, 52) = 1 β 2 (0, 52) = 0, 7071 (soit 70, 71%) alors que la puissance de la prise de décision avec l IF de Terminale est η(0, 52) = 1 β(0, 52) = 0, 7178 (soit 71, 78%). Par exemple dans le cas du calcul du risque de seconde espèce avec l IF de Seconde pour p 1 = 0, 53, qu on notera β 2 (0, 53) pour le distinguer de celui calculé avec l IF de Terminale, on obtient : β 2 (0, 53) = P(F 0,53 [0, 4842, 0, 5158]) = P(S 0,53 [1957, 2083]). Soit β 2 (0, 53) = P(S 0,53 2083) P(S 0,53 1956) = 0, 0345 0 = 0, 0345. D où un risque de seconde espèce de 3, 45%. La puissance de la prise de décision avec l IF de Seconde est donc η 2 (0, 53) = 1 β 2 (0, 53) = 0, 9655 (soit 96, 55%). Par exemple dans le cas du calcul du risque de seconde espèce avec l IF de Seconde pour p 1 = 0, 51, qu on notera β 2 (0, 51) pour le distinguer de celui calculé avec l IF de Terminale, on obtient : β 2 (0, 51) = P(F 0,51 [0, 4842, 0, 5158]) = P(S 0,51 [1957, 2083]). Soit β 2 (0, 51) = P(S 0,51 2083) P(S 0,51 1956) = 0, 7664 0, 0005 = 0, 7659. D où un risque de seconde espèce de 76, 59%. La puissance de la prise de décision avec l IF de Seconde est donc η 2 (0, 53) = 1 β 2 (0, 53) = 0, 2341 (soit 23, 41%). En résumé, avec la règle de décision que nous avons construite dans cette prise de décision sur l équilibre de la pièce de Buffon, nous avons 4, 74% (pratiquement 5%) de chances de décider que la pièce n est pas équilibrée alors qu en réalité elle l est (erreur de type I) et nous avons environ : 76, 59% de chances de décider que la pièce est équilibrée alors qu en réalité elle ne l est pas si la vraie valeur (inconnue) de la probabilité d obtenir "pile" en la lançant est p 1 = 0, 51 29, 29% de chances de décider que la pièce est équilibrée alors qu en réalité elle ne l est pas si la vraie valeur (inconnue) de la probabilité d obtenir "pile" en la lançant est p 1 = 0, 52 3, 45% de chances de décider que la pièce est équilibrée alors qu en réalité elle ne l est pas si la vraie valeur (inconnue) de la probabilité d obtenir "pile" en la lançant est p 1 = 0, 53 5.3 Calculs avec l IF de Première Comme avec la variable de décision S p, les IF de Terminale et de Première sont les mêmes, on retrouve les mêmes valeurs pour les risques de première et de seconde espèces avec l IF de Première qu avec celui de Terminale. Le risque de première espèce est donc P(S 0,5 [1958, 2082]) = P(S 0,5 < 1958)+P(S 0,5 > 2082), où les calculs de probabilité sont conduits sous l hypothèse que la pièce est bien équilibrée, ce qui revient à considérer que le nombre de "pile" dans n lancers est exactement une variable binomiale de paramètre n = 4040 et de proportion p 0 = 0, 5. La lecture de la loi binomiale de paramètre n = 4040 et de proportion 0, 5 à l aide d un tableur 12

permet d obtenir le risque de première espèce α = P(S 0,5 [1958, 2082]) = P(S 0,5 < 1958)+(1 P(S 0,5 2082) = 0, 0246+(1 0, 9754) = 0, 0492, soit 4, 92%. Dans cette prise de décision, le risque de première espèce α est exactement différent du seuil initial de 5% fixé pour prendre la décision. Le risque de seconde espèce dans la prise de décision avec l IF de Première, par exemple, pour p 1 = 0, 52, qu on notera β 1 (0, 52) pour le distinguer de celui calculé avec l IF de Terminale β 1 (0, 52) et de celui de Seconde β 2 (0, 52), on obtient : β 1 (0, 52) = P(S 0,52 [1958, 2082]). La lecture de la loi binomiale de paramètre n = 4040 et de proportion 0, 52 à l aide d un tableur permet d obtenir le risque de seconde espèce β 1 (0, 52) = P(S 0,52 2082) P(S 0,52 < 1958) = 0, 2822 0 = 0, 2822. Soit un risque de seconde espèce, de 28, 22% au lieu de 28, 43% pour la prise de décision avec l IF de Terminale, et 29, 81% pour la prise de décision avec l IF de Seconde. La puissance de la prise de décision avec l IF de Première est donc η 1 (0.52) = 1 β 1 (0, 52) = 0, 7178 (soit 71, 78%) alors que la puissance de la prise de décision avec l IF de Terminale est η(0.52) = 1 β(0, 52) = 0, 7157 (soit 71, 57%) et de celle avec l IF de Seconde est η 2 (0.52) = 0, 7019 (soit 70, 19%).

75, 60% de chances de décider que la pièce est équilibrée alors qu en réalité elle ne l est pas si la vraie valeur (inconnue) de la probabilité d obtenir "pile" en la lançant est p 1 = 0, 51 28, 22% de chances de décider que la pièce est équilibrée alors qu en réalité elle ne l est pas si la vraie valeur (inconnue) de la probabilité d obtenir "pile" en la lançant est p 1 = 0, 52 3, 22% de chances de décider que la pièce est équilibrée alors qu en réalité elle ne l est pas si la vraie valeur (inconnue) de la probabilité d obtenir "pile" en la lançant est p 1 = 0, 53 6 Conclusion Résumons les valeurs obtenues dans le tableau ci-dessous : Classe α β(0, 51) β(0, 52) β(0, 53) Seconde 4, 74 76, 59 29, 29 3, 45 Première & Terminale 4, 92 75, 60 28, 22 3, 22 On observe : le choix de l IF a peu de conséquence sur la prise de décision ; on voit en quoi la longueur de l IF intervient dans la performance de la prise de décision ; plus l écart entre p 0 et p 1 est important, plus le prise de décision est performante et plus on peut discriminer les deux hypothèses ; qu on fasse les calculs exacts ou avec l approximation normale les valeurs obtenues sont très voisines ; le choix de la variable de décision détermine l IF ; la théorie des tests a pour objet, un risque de première espèce α étant donné, de trouver des variables de décisions qui minimisent les risques de seconde espèce 14