TP Bonus : Simulation de variables aléatoires

Documents pareils
Arrondissage des résultats de mesure. Nombre de chiffres significatifs

Mécanique : Cinématique du point. Chapitre 1 : Position. Vitesse. Accélération

Tests non-paramétriques de non-effet et d adéquation pour des covariables fonctionnelles

Méthodes de Simulation

Voyez la réponse à cette question dans ce chapitre.

Chapitre 7 : Intégration sur un intervalle quelconque

Utiliser Internet Explorer

2.1 Comment fonctionne un site?

Exercice autour de densité, fonction de répatition, espérance et variance de variables quelconques.

EXERCICE 4 (7 points ) (Commun à tous les candidats)

Simulation de variables aléatoires

Continuité en un point

Moments des variables aléatoires réelles

L étalonnage par traceur Compton, une nouvelle méthode de mesure primaire d activité en scintillation liquide

Séminaire TEST. 1 Présentation du sujet. October 18th, 2013

OBJECTIFS. I. A quoi sert un oscilloscope?

Limites finies en un point

Autour des nombres et des polynômes de Bernoulli

Suites numériques 4. 1 Autres recettes pour calculer les limites

Équations générales des milieux continus

* très facile ** facile *** difficulté moyenne **** difficile ***** très difficile I : Incontournable T : pour travailler et mémoriser le cours

THESE. Applications des algorithmes d'auto-organisation à la classification et à la prévision

Simulation numérique de la réponse d un pieu en cours de battage

Correction du baccalauréat ES/L Métropole 20 juin 2014

MODELES DE DUREE DE VIE

MÉTHODE DE MONTE CARLO.

Raisonnement par récurrence Suites numériques

4. Martingales à temps discret

Image d un intervalle par une fonction continue

La fonction exponentielle

Chapitre 2 Le problème de l unicité des solutions

Feuille 6 : Tests. Peut-on dire que l usine a respecté ses engagements? Faire un test d hypothèses pour y répondre.

ÉTUDE BDC LES CINQ FACTEURS CLÉS ET LES CINQ PIÈGES À ÉVITER POUR RÉUSSIR EN AFFAIRES

Annexe commune aux séries ES, L et S : boîtes et quantiles

Commun à tous les candidats

Loi binomiale Lois normales

Espérance conditionnelle

Baccalauréat ES Pondichéry 7 avril 2014 Corrigé

Estimations d erreur a priori de la méthode de Lagrange Galerkin pour les équations de type Kazhikhov Smagulov

Abstract. Key-words: The flowshop problem, Heuristics, Job scheduling, Total flowtime.

PRIME D UNE OPTION D ACHAT OU DE VENTE

TP1 Méthodes de Monte Carlo et techniques de réduction de variance, application au pricing d options

PROBABILITES ET STATISTIQUE I&II

Texte Agrégation limitée par diffusion interne

Introduction à la statistique non paramétrique

De même, le périmètre P d un cercle de rayon 1 vaut P = 2π (par définition de π). Mais, on peut démontrer (difficilement!) que

3. Conditionnement P (B)

Leçon 01 Exercices d'entraînement

Cours de Tests paramétriques

Le modèle de Black et Scholes

Économetrie non paramétrique I. Estimation d une densité

DOSSIER SUR LE SECTEUR DES NOMS DE DOMAINE VOLUME 11 - NUMÉRO 4 - JANVIER 2015

Continuité d une fonction de plusieurs variables

UFR de Sciences Economiques Année TESTS PARAMÉTRIQUES

Statistique inférentielle TD 1 : Estimation

Introduction au logiciel SAS François-Xavier LEJEUNE

TSTI 2D CH X : Exemples de lois à densité 1

L indice des prix à la consommation

Continuité et dérivabilité d une fonction

Filtrage stochastique non linéaire par la théorie de représentation des martingales

INF6304 Interfaces Intelligentes

Théorème du point fixe - Théorème de l inversion locale

Correction du Baccalauréat S Amérique du Nord mai 2007

VIII- Circuits séquentiels. Mémoires

Intégration et probabilités TD1 Espaces mesurés Corrigé

Souad EL Bernoussi. Groupe d Analyse Numérique et Optimisation Rabat http ://

3 Approximation de solutions d équations

Baccalauréat ES Polynésie (spécialité) 10 septembre 2014 Corrigé

Exo7. Limites de fonctions. 1 Théorie. 2 Calculs

Modélisation et simulation

La mesure de Lebesgue sur la droite réelle

L export de SAS vers Excel expliqué à ma fille

PROBABILITÉS: COURS DE LICENCE DE MATHÉMATIQUES APPLIQUÉES LM 390

La mémoire C HAPITRE S EPT. 7.1 Qu est-ce que la mémoire? L utilisation de la mémoire à court terme 169

Optimisation non linéaire Irène Charon, Olivier Hudry École nationale supérieure des télécommunications

CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures)

Principe de symétrisation pour la construction d un test adaptatif

Communications numériques

La problématique des tests. Cours V. 7 mars Comment quantifier la performance d un test? Hypothèses simples et composites

Fonctions de plusieurs variables, intégrales multiples, et intégrales dépendant d un paramètre

Dérivation : cours. Dérivation dans R

Echantillonnage Non uniforme

Introduction à la Statistique Inférentielle

Exercices - Polynômes : corrigé. Opérations sur les polynômes

NOTE SUR LA MODELISATION DU RISQUE D INFLATION

Rappels sur les suites - Algorithme

Chapitre 2. Eléments pour comprendre un énoncé

Développement décimal d un réel

CAPTEURS - CHAINES DE MESURES

Mathématiques financières

Corrigé des TD 1 à 5

Température corporelle d un castor (une petite introduction aux séries temporelles)

Baccalauréat ES/L Métropole La Réunion 13 septembre 2013 Corrigé

EXERCICE II : LE TELEPHONE "POT DE YAOURT" (5 points)

INITIATION AU LOGICIEL SAS

Travaux dirigés d introduction aux Probabilités

Quantification Scalaire et Prédictive

La Licence Mathématiques et Economie-MASS Université de Sciences Sociales de Toulouse 1

Estimation et tests statistiques, TD 5. Solutions

Exemples d application

Transcription:

IMIS : Master 1 Université Paris Est Marne la Vallée TP Bonus : Siulation de variables aléatoires 1. Siulation de lois Dans les applications, on a souvent besoin de générer de façon artificielle (à l aide d un ordinateur) une suite X 1,, X n de nobres aléatoires i.i.d. suivant la loi donnée F. Les éthodes de siulation perettent seuleent d obtenir une valeur pseudo-aléatoire X i, au lieu d une valeur aléatoire. Cela signifie que les nobres X 1,, X n siulés sont déterinistes (ils sont obtenus par un algorithe déteriniste) ais les propriétés de la suite X 1,, X n sont proches d une suite aléatoire iid de loi donnée. Par exeple pour les X i pseudo-aléatoires on a la propriété de Glivenko-Cantelli : sup F n (x) F (x) 0 quand n, x ais il s agit ici de la convergence au sens déteriniste. 1.1. Siulation des variables uniforéent distribuées. La f.d.r. F U ( ) de la loi unifore U[0, 1] s écrit sous la fore F U (x) = x1 [0,1] (x) + 1 ]1,+ ] (x). Le prograe-générateur d un échantillon pseudo-aléatoire U 1,, U n de cette loi est disponible dans de nobreux logiciels. Le principe de son fonctionneent est le suivant : on se donne un réel a > 1 et un entier (a et seront choisis très grands). On coence par une valeur Z 0 fixe. Pour tout i {1,, n}, on définit z i = le reste de la division de az i 1 par = az i 1 [ az i 1 ]. Pour tout i {1,, n}, nous avons toujours 0 z i <. On définit U i = z i = az i 1 [ az i 1 ]. Ainsi, pour tout i {1,, n}, 0 U i < 1. La suite U 1,, U n est considérée coe un échantillon de la loi unifore U[0, 1]. Bien que cette suite n est pas aléatoire, on peut ontrer que sa f.d.r. epirique Fn U (x) = 1 n 1 Ui x n est telle que sup x F U n (x) F (x) = sup x [0,1] F U n (x) x ɛ(n, ) avec ɛ(n, ) qui converge très vite vers 0 quand et n. i=1 1

2 1. Coe la plupart des logiciels, SAS dispose d un générateur de nobres pseudo-aléatoires. Afin de siuler un échantillon de n = 50 v.a. iid de loi unifore U[0, 1], exécuter le prograe suivant : DATA TableCree ; DO i=1 TO 50 ; y=ranuni(10) ; KEEP y ; PROC PRINT ; Le paraètre (10) est la graine ou seence du générateur. Réexécuter le prograe avec la êe valeur, une autre valeur, plusieurs fois avec la valeur 1. Une valeur négative coe 1 provoque l utilisation de l horloge interne coe seence aléatoire. Cette dernière seence seble généré des nobres plus aléatoires ais avec un inconvénient : il est ipossible de regénérer le êe échantillon à un autre instant et donc de coparer des éthodes de façon rigoureuse. 1.2. Siulation des variables de loi générale. Etant donné un échantillon iid U 1,, U n d une loi unifore, on peut obtenir un échantillon d une loi générale F ( ) par la éthode d inversion. Elle est opérationnelle si F 1 est disponible sous fore explicite. Cette éthode est basée sur la proposition suivante : Proposition 1.1. Soit F une f.d.r. continue et stricteent croissante et soit U une v.a. uniforéent distribuée sur [0, 1]. Alors la v.a. suit la loi F. X = F 1 (U) Il en découle l algorithe de siulation suivant : si F est une f.d.r. continue et stricteent croissante, on pose X i = F 1 (U i ), où les U i sont des nobres pseudo-aléatoires uniforéent distribués sur [0, 1] générés coe expliqué précédeent. On obtient ainsi un échantillon siulé (X 1,, X n ) de loi F. Si F n est pas continue ou stricteent croissante, il faut odifier la définition de l inverse de F et considérer l inverse généralisée définie par : pour tout u [0, 1], F 1 (u) = inf{x R t.q. F (x) u},

avec la convention inf = +. On a alors que y F 1 (u) F (y) u. Cela iplique que si X a pour f.d.r. F et si U U[0, 1], alors F 1 (U) a la êe loi que X. Exeple 1. Siulation d un échantillon de loi exponentielle E(1). On a f(x) = e x 1 (x>0) et F (x) = (1 e x )1 (x>0). Ainsi F 1 (y) = ln(1 y) pour y (0, 1). Posons alors X i = ln(1 U i ) où les U i sont des nobres pseudo-aléatoires uniforéent distribués sur [0, 1]. Exeple 2. Siulation d un échantillon de loi de Bernoulli. Soit On a alors pour y [0, 1], P (X = 1) = p et P (X = 0) = 1 p, 0 < p < 1. F 1 (y) = inf{x R t.q. F (x) y} = { 0 si y [0, 1 p] 1 si y ]1 p, 1]. Si U i est une v.a. de loi unifore, alors X i = F 1 (U i ) suit la loi de Bernoulli. On pose alors { 0 si U i [0, 1 p] X i = 1 si U i ]1 p, 1]. 2. A l aide de la éthode d inversion, siuler un échantillon de taille n = 100 de v.a. iid de loi exponentielle de paraètre 1. Refaire la êe déarche en utilisant l instruction ranexp(10). Les instructions rannor(10) et rancau(10) perettent respectiveent de siuler des lois norales et des lois de Cauchy. A l aide de l instruction rannor(10), siuler un n = 50 échantillon de loi N (1, 4). 1.3. Siulation des variables de loi gaussienne. On présente ci-dessous deux éthodes connues pour générer des variables (pseudo) aléatoires suivant une loi gaussienne. 1.3.1. Via le théorèe central liite. Pour U U[0, 1], on a E(U) = 1/2 et Var(U) = 1/12. Vu le TCL, si les U i sont iid et de loi U[0, 1], on a que 3 U 1 + + U N N/2 N/12 N N (0, 1) en loi. La valeur N = 12 est déjà suffisante pour obtenir une bonne approxiation de la loi norale. On en déduit la éthode de siulation suivante : on génère U 11,, U nn, une suite de variables pseudo-aléatoires de loi U[0, 1] et on pose ensuite X i = U i1 + + U in N/2 N/12 N N (0, 1), i = 1,, n. On obtient ainsi un échantillon siulé (X 1,, X n ) de la loi approxiativeent N (0, 1).

4 3. Exécuter le prograe suivant DATA TableCree ; ARRAY si{12} y1-y12 ; DO i=1 TO 1000 ; DO j=1 TO 12 ; PROC PRINT ; si{j}=ranuni(-1) ; S=su(of y1-y12) ; KEEP S ; Lancer SAS/INSIGHT : solutions/analyse/analyse interactive des données. Charger la table créée ci-dessus : work/tablecree/ok Pour obtenir de belles sorties graphiques et des estiations de la densité : Analyze/Distribution /S/Y/OK Curves/ kernel density/ok 1.3.2. Via la éthode de Box et Müller. Nous renvoyons au TP5 pour un descriptif de cette éthode. 2. Siulations d intervalles de confiance On considère la loi norale de oyenne 5 et d écart type 2 et on prendra pour seuil α = 0, 05. En supposant σ = 2 connu, nous tirons un échantillon de taille 25 par exeple. Celui-ci nous peret d avoir une estiation par intervalle de µ (que l on sait valoir 5). Cet intervalle peut contenir ou non le paraètre à estier : tout dépend de l échantillon obtenu. Nous allons considérer 100 échantillons et exainer les intervalles de confiance. 4. Exécuter les prograes suivants :

DATA siul ; n=25 ; nechantillon=100 ; u=5 ; siga=2 ; DO j=1 TO nechantillon ; DO i=1 TO n ; x=siga*rannor(0)+u ; DROP i nechantillon ; 5 PROC MEANS Noprint ; VAR x ; OUTPUT Out=oyennes ean= ; BY j ; DATA intervalles ; SET oyennes ; siga=2 ;n=25 ; u=5 ; a=-siga*1.96/sqrt(n) ; b=+siga*1.96/sqrt(n) ; SYMBOL1 i=join c=red width=1 ; SYMBOL2 i=join c=blue width=1 ; SYMBOL3 i=join c=green width=1 ; TITLE Bornes de confiance de u=5 au niveau alpha=0.05 ; PROC GPLOT Data=intervalles ; PLOT a*j=1 u*j=2 b*j=3 / Overlay ; TITLE ; QUIT ;