1 Un objet aléatoire de base : le dé



Documents pareils
Annexe commune aux séries ES, L et S : boîtes et quantiles

Soit la fonction affine qui, pour représentant le nombre de mois écoulés, renvoie la somme économisée.

Fluctuation d une fréquence selon les échantillons - Probabilités

UFR de Sciences Economiques Année TESTS PARAMÉTRIQUES

Probabilités Loi binomiale Exercices corrigés

Probabilités conditionnelles Loi binomiale

Statistique : Résumé de cours et méthodes

Estimation: intervalle de fluctuation et de confiance. Mars IREM: groupe Proba-Stat. Fluctuation. Confiance. dans les programmes comparaison

TSTI 2D CH X : Exemples de lois à densité 1

Probabilités. Rappel : trois exemples. Exemple 2 : On dispose d un dé truqué. On sait que : p(1) = p(2) =1/6 ; p(3) = 1/3 p(4) = p(5) =1/12

LES GENERATEURS DE NOMBRES ALEATOIRES

Baccalauréat ES Polynésie (spécialité) 10 septembre 2014 Corrigé

Exercices sur le chapitre «Probabilités»

Chapitre 1 : Évolution COURS

Les probabilités. Chapitre 18. Tester ses connaissances

Texte Agrégation limitée par diffusion interne

Statistiques Descriptives à une dimension

Probabilités. Une urne contient 3 billes vertes et 5 billes rouges toutes indiscernables au toucher.

Correction du baccalauréat STMG Polynésie 17 juin 2014

Couples de variables aléatoires discrètes

LES DECIMALES DE π BERNARD EGGER

Estimation et tests statistiques, TD 5. Solutions

BTS Groupement A. Mathématiques Session Spécialités CIRA, IRIS, Systèmes électroniques, TPIL

Exercices supplémentaires sur l introduction générale à la notion de probabilité

Probabilités et Statistiques. Feuille 2 : variables aléatoires discrètes

Correction du baccalauréat ES/L Métropole 20 juin 2014

Comment se servir de cet ouvrage? Chaque chapitre présente une étape de la méthodologie

La survie nette actuelle à long terme Qualités de sept méthodes d estimation

MATHÉMATIQUES. Mat-4104

Probabilités conditionnelles Exercices corrigés

Mathématiques financières

Exemple On lance une pièce de monnaie trois fois de suite. Calculer la probabilité d obtenir exactement deux fois pile.

Coefficients binomiaux

Chapitre 3 : Principe des tests statistiques d hypothèse. José LABARERE

315 et 495 sont dans la table de 5. 5 est un diviseur commun. Leur PGCD n est pas 1. Il ne sont pas premiers entre eux

I. Cas de l équiprobabilité

Probabilités (méthodes et objectifs)

Probabilités sur un univers fini

SOCLE COMMUN - La Compétence 3 Les principaux éléments de mathématiques et la culture scientifique et technologique

Terminale STMG Lycée Jean Vilar 2014/2015. Terminale STMG. O. Lader

BACCALAURÉAT PROFESSIONNEL SUJET

Chaînes de Markov au lycée

I3, Probabilités 2014 Travaux Dirigés F BM F BM F BM F BM F B M F B M F B M F B M

POKER ET PROBABILITÉ

Baccalauréat ES Pondichéry 7 avril 2014 Corrigé

avec des nombres entiers

Manuel d utilisation 26 juin Tâche à effectuer : écrire un algorithme 2

Exo7. Probabilité conditionnelle. Exercices : Martine Quinio

Découverte du tableur CellSheet

Leçon N 4 : Statistiques à deux variables

Exercices types Algorithmique et simulation numérique Oral Mathématiques et algorithmique Banque PT

P1 : Corrigés des exercices

Statistiques Décisionnelles L3 Sciences Economiques & Gestion Faculté d économie, gestion & AES Université Montesquieu - Bordeaux

Probabilités. C. Charignon. I Cours 3

Statistiques 0,14 0,11

Représentation d une distribution

Le Data Mining au service du Scoring ou notation statistique des emprunteurs!

Chapitre 3 : INFERENCE

FORMATION CONTINUE SUR L UTILISATION D EXCEL DANS L ENSEIGNEMENT Expérience de l E.N.S de Tétouan (Maroc)

Séries Statistiques Simples

4 Distributions particulières de probabilités

Le suivi de la qualité. Méthode MSP : généralités

Classe de première L

Principes de mathématiques 12 SÉRIE DE PROBLÈMES. Septembre Student Assessment and Program Evaluation Branch

Cet exposé s intègre dans les travaux développés par une Equipe en Projet INRP-IUFM,

NOTE SUR LA MODELISATION DU RISQUE D INFLATION

Débuter avec Excel. Excel

LEÇON N 7 : Schéma de Bernoulli et loi binomiale. Exemples.

Tableau 1 : Structure du tableau des données individuelles. INDIV B i1 1 i2 2 i3 2 i4 1 i5 2 i6 2 i7 1 i8 1

4 Statistiques. Les notions abordées dans ce chapitre CHAPITRE

ACTUARIAT 1, ACT 2121, AUTOMNE 2013 #4-5

Probabilité. Table des matières. 1 Loi de probabilité Conditions préalables Définitions Loi équirépartie...

Seconde Généralités sur les fonctions Exercices. Notion de fonction.

Baccalauréat ES/L Amérique du Sud 21 novembre 2013

Statistique Descriptive Élémentaire

TP 1 Prise en main de l environnement Unix

Logiciel XLSTAT version rue Damrémont PARIS

PROBABILITÉS CONDITIONNELLES

Introduction à l approche bootstrap

Licence MASS (Re-)Mise à niveau en Probabilités. Feuilles de 1 à 7

Chapitre 3. Les distributions à deux variables

Les probabilités. Guide pédagogique Le présent guide sert de complément à la série d émissions intitulée Les probabilités produite par TFO.

Les devoirs en Première STMG

Théorie et Codage de l Information (IF01) exercices Paul Honeine Université de technologie de Troyes France

Université Paris 8 Introduction aux probabilités Licence Informatique Exercices Ph. Guillot. 1 Ensemble fondamental loi de probabilité

EXPLOITATIONS PEDAGOGIQUES DU TABLEUR EN STG

THEME : CLES DE CONTROLE. Division euclidienne

Date M.P Libellé Catégorie S.Catégorie Crédit Débit Solde S.B

Réseau SCEREN. Ce document a été numérisé par le CRDP de Bordeaux pour la. Base Nationale des Sujets d Examens de l enseignement professionnel.

La simulation probabiliste avec Excel

STATISTIQUES A DEUX VARIABLES

Complément d information concernant la fiche de concordance

Mesures et incertitudes

NOTIONS DE PROBABILITÉS

t 100. = 8 ; le pourcentage de réduction est : 8 % 1 t Le pourcentage d'évolution (appelé aussi taux d'évolution) est le nombre :

Peut-on imiter le hasard?

16 Chapitre 16. Autour des générateurs pseudoaléatoires

Utiliser Dev-C++ .1Installation de Dev-C++ Table des matières

MODE OPERATOIRE CIEL GESTION COMMERCIALE VERSION EVOLUTION BTS PME PMI

Transcription:

Dans le monde des statistiques, il est bien évident qu on ne fait plus aucun calcul à la main. Si nous le faisons en cours de mathématiques, c est pour mieux comprendre ce que font les divers logiciels et pour connaître les pièges de ces notions. L un des logiciels utiles et surtout gratuit (argument important pour nous étudiants et professeurs) est le logiciel (http://www.r-project.org/). Bien qu en anglais, il reste accessible mais néanmoins extrémement puissant. Commençons son exploration par les bases. 1 Un objet aléatoire de base : le dé 1. Démarrer le logiciel R (Démarrer/tous les programmes/r/r 2.9.2). 2. Quand on lance un dé non truqué, les résultats possibles sont 1, 2, 3, 4, 5 ou 6. (a) Précisons au logiciel ce qu est un dé avec l instruction :d=1:6 (b) Demandons maintenant ce que contient l objet d en tapant simplement :d On dit que d est un objet liste. 3. Pour un logiciel, lancer un dé c est donc choisir au hasard un nombre dans l ensemble des résultats possibles. (a) C est aussi un échantillon de taille 1 de l objet d :sample(d,1) (b) Avec la flèche vers le haut, rappeler plusieurs fois cette commande. Obtient-on toujours le même résultat? Le dé est-il équilibré? (c) Lancer le dé 6 fois à l aide de la seule commande :sample(d,6) Relancer plusieurs fois cette commande. A-t-on ce que l on espère? Qu est-ce qui semble «louche»? (d) Demander l aide sur cette fonction en tapant :help("sample") Comment faire pour obtenir 6 lancers du dé? Peut-on truquer le dé? 4. Présentons de nombreuses informations : (a) Lancer 100 fois le dé et ranger les résultats dans la variable s :s=sample(d,100,t) (b) afficher le contenu de s en tapant simplement :s Remarque : On aurait pu tout faire en une seule ligne, il suffit de séparer les instructions par un point-virgule, comme ceci :s=sample(d,100,t); s (c) Les données sont illisibles du fait de leur grand nombre. Résumons les à l aide d un tableau :t=table(s); t Présentons ce tableau à l aide d un diagramme en barre :barplot(t) 5. Construisons maintenant une fonction qui fasse toutes les étapes. Nous souhaitons simplement pouvoir donner le nombre de lancers. (a) Taper : f=function(n){d=1:6; s=sample(d,n,t); t=table(s); print(t); barplot(t)} (b) essayer la fonction avec :f(500) 2 Fluctuation d échantillonnage 1. Taperf(100), puis à nouveau f(100) Que s est-il passé? Ce phénomène est appelé fluctuation d échantillonnage 1. 2. Rappeler la commandef(100) plusieurs fois pour observer cette fluctuation. 1. Le changement de hauteur des barres du diagramme indique la fluctuation d échantillonnage.

BTS ACSE/GPN/TV 3. Recommencer et observer la fluctuation d échantillonnage avec 1000 lancers puis 10000 lancers, 100000 lancers et 1000000 lancers. Quelle conclusion concernant la fluctuation d échantillonnage peut-on déduire de ce qui précède? 4. Quand on lance un dé bien équilibré on a 1 chance sur 6 d obtenir la face 5 (de même pour les autres faces). Retrouve-t-on ce résultat? 5. Application : deviner la composition de l urne. Une urne bien cachée dans la mémoire de l ordinateur contient 470 boules de couleurs. Le but de l exercice est de trouver la composition de cette urne. (a) Ouvrir le fichier «Secrets». (b) Que réalise l instruction suivante :s=sample(urnesecrete,1,t); s? (c) On étudie des échantillons de taille 10 et on observe les tables et les diagrammes obtenus : s=sample(urnesecrete,10,t); t=table(s); t; barplot(t) Quelles sont les couleurs des boules contenues dans l urne? (d) En modifiant la taille de l échantillon, déterminer la composition de l urne en pourcentage. Commenter votre démarche et présenter un diagramme qui justifie votre réponse. En déduire la composition de l urne. 3 Le problème des sondages Nous savons tout, nous voyons tout! On imagine une population composée de 1000000 d individus. La moitié des individus possèdent une certaine caractéristique qui est codée par le chiffre 1. L autre moitié est codée par 0. On effectue des sondages dans cette population et étudie les résultats. 1. On définit la population :population=c(rep(0,500000),rep(1,500000)) 2. (a) Un échantillon de 1000 :échantillon=sample(population,1000); échantillon (b) Dans cet échantillon, combien d individus possèdent la caractéristique étudiée? s=sum(échantillon) (c) Quel pourcentage cela représente-t-il? s*100/1000 (d) En abrégé :s=sum(sample(population,1000))/10; s 3. En rappelant cette instruction vous obtiendrez le résultat d autant de sondages que vous le souhaitez...chose qu on ne peut pas se permettre en réalité. (a) Dans quel intervalle se trouvent les résultats observés? (b) Dans la population choisie on sait que 50% des personnes possèdent la caractéristique étudiée. Quelle est la marge d erreur induite par le sondage? 4. Pour affiner cette estimation nous allons faire un grand nombre de sondages, par exemple 500 sondages. (a) L instruction est la suivante : L=c(); for(i in 1:500) L=c(sum(sample(population,1000))/10,L) (b) Pour analyser les résultats :hist(l,prob=true) Quelle loi de probabilité peut produire cet histogramme? Un indice de plus? Taper l instruction :hist(l,prob=true,nclass=20) Un indice de plus? Taper l instruction :lines(density(l,bw=1)) (c) Calculons quelques valeurs caractéristiques : Taper l instruction :mean(l), la moyenneµdes 500 échantillons est : Taper l instruction :sd(l), l écart typeσdes 500 échantillons est : Taper l instruction :length(l[(l>mean(l)-sd(l))&(l<mean(l)+sd(l))])/500, le pourcentage des 500 échantillons dans l intervalle[µ σ;µ+σ] est :

Taper l instruction :length(l[(l>mean(l)-2*sd(l))&(l<mean(l)+2*sd(l))])/500, le pourcentage des 500 échantillons dans l intervalle[µ 2σ;µ+2σ] est : Taper l instruction :length(l[(l>mean(l)-3*sd(l))&(l<mean(l)+3*sd(l))])/500, le pourcentage des 500 échantillons dans l intervalle[µ 3σ;µ+3σ] est : Taper l instruction : length(l[(l>mean(l)-2/3*sd(l))&(l<mean(l)+2/3*sd(l))])/500, le pourcentage des 500 échantillons dans l intervalle[µ 2 σ;µ+ 2 σ] est : 3 3 Calculer 100 0,5(1 0,5) 1000 et le comparer avecσ. (d) À l aide du graphique ci-dessous repris du cours et des informations trouvées ci-dessus, quelle est la loi de la variable aléatoire X où X est la fréquence en pourcentage des individus ayant une certaine caractéristique dans un échantillon de 500 individus choisis de manière indépendante? 1 σ 2π µ 3σ µ 2σ µ σ µ 2 3 σ µ µ+ 2 3 σ µ+σ µ+2σ µ+3σ 0, 5 0, 68 0, 95 0, 997 (e) Taper l instruction : quantile(l,c(0.025,0.975)). La réponse signifie que 95% des résultats sont dans l intervalle affiché. Quelle est la valeur de k telle que Φ(k) = 0, 975? Que vautµ 1, 96σ? Que vautµ+1, 96σ? Si la loi de X est la loi (µ;σ), que vaut P(µ 1, 96σ X µ+1, 96σ)? Cela explique-t-il les valeurs trouvées par le logiciel au début de la question? 5. Application : Nous ne savons rien, nous ne voyons que le résultat d un seul sondage! Vous réalisez un sondage sur un échantillon de 1000 personnes parmi la population de Secreteville (qui comporte 1 million d habitants). Vous posez la question suivante : «Pensez-vous que l étude des statistiques au lycée soit utile?». La réponse «oui» est codée par 1 et la réponse «non» est codée par 0. Quelle estimation pourriez-vous publier? Donner par calcul un intervalle dans lequel on trouvera 95% des estimations. 4 Un premier test statistique : le test duχ 2 Le dé que vous lancez est-il vraiment bien équilibré? Les résultats que l on obtient en lançant un dé sont censés suivre la loi uniforme : à chacun des 6 résultats possibles, on attribue la probabilité 1 ; c est la symétrie du cube qui nous amène à penser cela. 6

BTS ACSE/GPN/TV En pratique cependant, on observe une certaine fluctuation des résultats : si on lance le dé 120 fois, il est rarissime d obtenir exactement 20 résultats de chaque sorte! À titre d exemple, on pourrait obtenir la table suivante : résultat 1 2 3 4 5 6 Effectifs observés 21 16 22 24 18 19 Effectifs théoriques 20 20 20 20 20 20 Il n est pas évident, au vu de ces résultats, de déterminer si les différences sont dues à des fluctuations normales, ou si elles sont dues à un déséquilibre du dé. 4.1 Élaboration d un test 1. Dans Fichier, Charger l environnement de travail, choisir d ouvrir le fichier «adequat.r». 2. Vous pouvez maintenant faire un grand nombre d essais, sur un dé de référence parfaitement équilibré : (a) Tapezn_Lancers(), 120 résultats s affichent ; (b) Une simple table des résultats serait plus lisible ; ou bien un tracé en bâtons TapezDé0(), et vous obtiendrez les 2. (c) En rappelant la ligne précédente avec la touche «flèche vers le haut», vous pouvez effectuer un grand nombre d essais. Ceci permet de se faire une première idée des fluctuations possibles sur un dé bien équilibré. L appréciation de ces fluctuations nécessite la prise en compte simultanée de 6 valeurs numériques ; 3. La tâche serait plus facile si on synthétisait ces informations en une seule valeur numérique. L idée est de mesurer l écart entre les effectifs observés et les effectifs théoriques. (a) tapezobservés= Dé0(); théorique=20 (b) Puisdifférence = observés - théorique (c) Puis(différence)ˆ2 qui donne les carrés des valeurs précédentes. (d) sum(différence) donne toujours 0 ; et donc aucune information. (e) Par contre sum((différence)ˆ2) n est nul que si les valeurs théoriques et observées coïncident (ce qui est rarissime) et croit quand les écarts croissent. Nous prendrons cette valeur comme indicative de l écart «théoriques par rapport à observées», et la noterons ECART. (f) Pour en faciliter les calculs, tapez en une ligne Obs=Dé0(); E=sum((Obs-20)ˆ2); Obs; paste(«ecart=»,e) Puis rappelez cette ligne d instruction grâce à la touche «flèche vers le haut» autant de fois que vous le souhaitez. Vous aurez ainsi une petite idée des valeurs possibles de l ECART. Notez 20 de ces valeurs. (g) Pour avoir une idée plus claire des valeurs possibles de ECART, nous allons collecter par simulations un grand nombre de valeurs de ECART. La fonction N_ECARTS() collecte 1000 valeurs de ECART et renvoie les résultats sous forme d une représentation graphique. Ce graphique, que nous appellerons graphique de référence, montre bien quelles sont les valeurs typiques auxquelles nous devons nous attendre. Souvenez vous que ces valeurs constituent une mesure des fluctuations ordinaires d un dé parfaitement équilibré

4. Pour aller plus loin il faut décider d un critère de sélection. Rangeons les 1000 valeurs de ECART par ordre croissant et notons E 0.95 la 950ème valeur, c est à dire le 95ième centile de cette série de 1000 valeurs. Dans la simulation de référence, 95% des résultats sont inférieurs à E 0.95. Un résultat supérieur sera considéré comme excentrique, même si, notez-le bien, il a été obtenu par le lancer d un dé bien équilibré, notre dé de référence! Notez également le caractère arbitraire de ce choix ; arbitraire mais raisonnable! la fonction N_Ecarts() recalcule un graphique de référence et y adjoint le nombre E 0.95 que nous appellerons valeur critique ; On obtient un graphique comme le suivant : 95% des valeurs de ECART sont inferieures à 214 effectifs 0 100 200 300 0 50 100 150 200 250 300 350 1000 valeurs de ECART, calculées sur 120 lancers Placez les 20 résultats obtenus en 3f sur votre graphique de référence. Combien de valeurs sont inféreures à E 0.95? 4.2 Mise en œuvre du test Soit à tester un nouveau dé. On décide de l accepter comme bien équilibré si la valeur de ECART que l on obtient suite à 120 lancers est inférieure à E 0.95 ; dans le cas contraire, il est écarté. Vous avez 9 dés à tester. 1. Pour lancer 120 fois le dé numero 7, tapezdé7() ; 2. Pour calculer la valeur de ECART relative à ce lancer, tapez : Obs=Dé7(); E=sum((Obs-20)ˆ2); Obs; paste(«ecart=»,e) Puis comparez le résultat à la valeur critique lue sur votre graphique de référence. 3. Pour vous faciliter la tâche, il existe une fonction Test, dont la syntaxe est Test(Dé7,120) qui donne une table portant sur 120 lancers du dé numéro 7, un graphique et la valeur de l Ecart correspondant. 4. Quels dés retiendriez-vous?