Statistiques Bayésiennes. Utilisation du logiciel WinBUGS



Documents pareils
Statistique Bayésienne

MANUEL D UTILISATION PRO-FACE

MCMC et approximations en champ moyen pour les modèles de Markov

Les simulations dans l enseignement des sondages Avec le logiciel GENESIS sous SAS et la bibliothèque Sondages sous R

Utilisation du Logiciel de statistique SPSS 8.0

MODELE A CORRECTION D ERREUR ET APPLICATIONS

Une introduction. Lionel RIOU FRANÇA. Septembre 2008

Méthodes de Simulation

Exemple PLS avec SAS

Exemple d application en CFD : Coefficient de traînée d un cylindre

Séance 0 : Linux + Octave : le compromis idéal

SharePoint (Toute la Gamme)... 1 Office 2010 (Toute la Gamme)... 2 OLAP (Toute la Gamme)... 2 STATISTICA Connecteur PI (Produit Complémentaire)...

Table des matières PRESENTATION DU LANGAGE DS2 ET DE SES APPLICATIONS. Introduction

Inférence d un réseau bayésien augmenté visant à confronter :

Studio. HERITIER Emmanuelle PERSYN Elodie. SCHMUTZ Amandine SCHWEITZER Guillaume

1 Modélisation d être mauvais payeur

SAS ENTERPRISE MINER POUR L'ACTUAIRE

Table des matières. I Mise à niveau 11. Préface

I. Programmation I. 1 Ecrire un programme en Scilab traduisant l organigramme montré ci-après (on pourra utiliser les annexes):

Analyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés

UNIVERSITE DES ANTILLES et DE LA GUYANE Campus de Fouillole BP Pointe-à-Pitre Cedex CONTRAT LE MASTER NOM DU DOMAINE STS

Raisonnement probabiliste

Exercices M1 SES Ana Fermin ( fermin.perso.math.cnrs.fr/ ) 14 Avril 2015

ECOWIN PRO. A retenir

Gnuplot. Chapitre Lancer Gnuplot. 3.2 Options des graphes

Température corporelle d un castor (une petite introduction aux séries temporelles)

TP Blender n 2 : Importation d un modèle SketchUp et animation

PRISE MAIN DE GOOGLE MAP ET GOOGLE EARTH DANS LE CADRE DE LA PREPARATION ET L EXPLOITATION D UNE JOURNEE DE TERRAIN

INTRODUCTION AU DATA MINING

Résumé des communications des Intervenants

1 Démarrer L écran Isis La boite à outils Mode principal Mode gadget Mode graphique...

Inspiration 7.5. Brève description d Inspiration. Avantages d Inspiration. Inconvénients d Inspiration

GUIDE DE DÉMARRAGE. SitagriPro Infinite FINANCEAGRI. Un service. c o r p o r a t e

Micro-ordinateurs, informations, idées, trucs et astuces utiliser le Bureau à distance

Tutorial NL220. Objectifs : Fournir un guide utilisateur pour NL220. Présenter une méthodologie efficace pour la création de projet

Exporter des écritures. Importer des écritures. Depuis EBP Comptabilité.

1-Introduction 2. 2-Installation de JBPM 3. 2-JBPM en action.7

TABLE DES MATIÈRES 1. DÉMARRER ISIS 2 2. SAISIE D UN SCHÉMA 3 & ' " ( ) '*+ ", ##) # " -. /0 " 1 2 " 3. SIMULATION 7 " - 4.

Comment consolider des données

Modélisation aléatoire en fiabilité des logiciels

Introduction à MATLAB R

VoD ( Video on Demand ) avec VLC

Sauvegarde et Restauration d un environnement SAS

Once the installation is complete, you can delete the temporary Zip files..

Table des matières L INTEGRATION DE SAS AVEC JMP. Les échanges de données entre SAS et JMP, en mode déconnecté. Dans JMP

COMMENCER AVEC VUE. Chapitre 1

Logiciel XLSTAT version rue Damrémont PARIS

Evaluation des modèles non-linéaires à effets mixtes

Open Office - Présentation

COURS WINDEV NUMERO 3

TP: Représentation des signaux binaires. 1 Simulation d un message binaire - Codage en ligne

MAILING KOMPOZER... 2 CREEZ UNE PAGE... 2 FORMAT DE LA PAGE... 2 AJOUTER DU TEXTE SUR UNE PAGE... 4

Installation.Net Framework 2.0 pour les postes utilisant Windows 8/8.1.

Quantification Scalaire et Prédictive

Introduction à R. Florence Yerly. Dept. de mathématiques, Université de Fribourg (CH) SP 2011

Surveillance de Scripts LUA et de réception d EVENT. avec LoriotPro Extended & Broadcast Edition

AVEC LIVE TRADER, VISEZ PLUS HAUT POUR VOS INVESTISSEMENTS

Une méthode de classification supervisée sans paramètre pour l apprentissage sur les grandes bases de données

GESTION DU LOGO. 1. Comment gérer votre logo? Format de l image Dimensions de l image Taille de l image 9

Gestion des sauvegardes

CONFIGURATION DE L AUTOMATE SIEMENS

Projet SINF2275 «Data mining and decision making» Projet classification et credit scoring

MEDIA NAV Guide de téléchargement de contenus en ligne

TD séance n 2c Mise à jour des Systèmes

Administration du site (Back Office)

< Atelier 1 /> Démarrer une application web

Mini_guide_Isis.pdf le 23/09/2001 Page 1/14

Introduction à Eclipse

Introduction aux outils BI de SQL Server Tutoriel sur SQL Server Integration Services (SSIS)

LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING»

données en connaissance et en actions?

Echantillonnage Non uniforme

Guide d utilisation de PL7 Pro Récupérer ou transférer un programme

AICp. Vincent Vandewalle. To cite this version: HAL Id: inria

DOSSIER D'UTILISATION

K. Ammar, F. Bachoc, JM. Martinez. Séminaire ARISTOTE - 23 octobre Palaiseau

ENDNOTE X2 SOMMAIRE. 1. La bibliothèque EndNote 1.1. Créer une nouvelle bibliothèque 1.2. Ouvrir une bibliothèque EndNote 1.3. Fermer une bibliothèque

PerSal Manuel d installation

Le langage C. Séance n 4

Approche par groupe de gènes pour les données longitudinales d expression génique avec une application dans un essai vaccinal contre le VIH

SPHINX Logiciel de dépouillement d enquêtes

Module Planification

Sélection du contrôleur

Modèles pour données répétées

Créer une trace, obtenir son fichier gpx et sa carte Ou Afficher un fichier trace GPX

INITIATION AU LOGICIEL SAS


Web service AREA Manuel d installation et d utilisation du mode déconnecté. Version du 18 mars 2011

BASE. Vous avez alors accès à un ensemble de fonctionnalités explicitées ci-dessous :

L'intelligence d'affaires: la statistique dans nos vies de consommateurs

STATISTIQUES. UE Modélisation pour la biologie

Introduction à l approche bootstrap

Web Science. Master 1 IFI. Andrea G. B. Tettamanzi. Université de Nice Sophia Antipolis Département Informatique andrea.tettamanzi@unice.

PREPROCESSING PAR LISSAGE LOESS POUR ACP LISSEE

Système Normalisé de Gestion des Bibliothèques -SYNGEB : version Réseau-

Surveillance et maintenance prédictive : évaluation de la latence de fautes. Zineb SIMEU-ABAZI Univ. Joseph Fourier, LAG)

Universal Robots. Fiche Méthode : Installation du simulateur Polyscope

Numérisation. Copieur-imprimante WorkCentre C2424

NOTE SUR LA MODELISATION DU RISQUE D INFLATION

Transcription:

Statistiques Bayésiennes Utilisation du logiciel WinBUGS

Partie I Prise en main Partie II Régression linéaire simple Partie III Modèle mixte (Albi) Partie IV Diagnostiques de convergence (CODA) Partie V Constriction de Doodle (DAG)

Partie I Prise en main

WinBUGS «Bayesian inference Using Gibbs Sampling» The BUGS Project WinBUGS http://www.mrc-bsu.cam.ac.uk/bugs/winbugs/contents.shtml David Spiegelhalter et al. Medical Research Council Biostatistics Unité of Cambridge ~ 996 Version en développement : OpenBUGS

Prise en main

Prise en main (MENU) File : Ouvrir, sauver, fermer Tools : Insertion formules, encodage, décodage Edit : Copier/Coller sélectionner Attributes : Police du texte Info : Log et information sur les nœuds Model : Définition du modèle Inference : Estimation, convergence sur le modèle Options: Affichage et update Doodle : Représentation graphique du modèle (Directed Acyclic Graphs) Map : Cartographie Text : Mise en forme du texte (recherche, paragraphes ) Window : Gestionnaire des fenêtres. Help: Manuels, tutoriaux et exemples.

Prise en main (FENETRES) Log (Info -> Open log) : Information de compilation Sortie des résultats dans la Log Options->Output options -> cocher log Fenêtre de script (File -> New) Fenêtre de spécification du modèle Fenêtres pop-up de résultats Bandeau inférieur (déroulement du programme)

Prise en main (VIDEO EXEMPLE) http://www.mrc-bsu.cam.ac.uk/bugs/winbugs/winbugsthemovie.html

Prise en main (PROGRAMMATION) Langage semblable à R Attention aux paramétrisation -> Voir Distributions dans Help Exemple de la loi normale N(µ,τ²) ~ N(µ,/σ²) Choix des a prioris : WinBUGS n autorise pas d a priori impropres. Le manuel propose des a prioris non informatifs. Paramètres de position µ : A priori N( 0, 0.000 ) Paramètres d échelle τ² : A priori G( 0.000, 0.000 )

Un exemple pour se convaincre Simulation puis estimation des paramètres d une loi normale: Simulation R : Loi Normale N(02,0) a<-rnorm(50, mean=02, sd=0) setwd("p:/") write.table(t(a),file="datanormale.txt", sep=',',row.names=false,col.names=false) Estimation Bayésienne des paramètres : µ et σ²

#MODEL model{ # Vraisemblance for (i in :N){ Qi[i]~dnorm(mu,tausq) } # A priori mu~dnorm(0,0.000) tausq~dgamma(0.000,0.000) # VariableInteret sigmasq<-/tausq } Cas Pratique Spécification Modèle -> Données -> Valeurs initiales #DATA list(simul=c(06.0739497332, 8.20382695254,,.889260634063,, 84.8659649363283),N=75) Data_gauss.txt #INITS CHAINE list(mu=0,tausq=) #INITS CHAINE 2 list(mu=200, tausq=000) Compilation (nombre de chaînes) 2 stratégies : chaîne très longue / avec éventuellement un échantillonnage espacé (thin) Plusieurs chaînes plus courtes

Cas Pratique Méthodologie - Update and Sample Update () Burn-in phase (ici 000): Simulations de la phase de chauffe Les valeurs prises par les paramètres ne sont pas sauvegardées. La longueur requise dépend du problème. Inférence Sample : définition des nœuds (ici mu, sigmasq) Set/Clear : Ajouter/Supprimer le nœud DIC : Set Update (2) Echantillonnage d intérêt (ici 0 000)

Cas Pratique Résultats a posteriori Sample : sélection du nœud ou * History/Trace : Evaluation de la convergence (mélangeance) mu chains :2 0.0 05.0 00.0 95.0 00 2500 5000 7500 0000 iteration sigmasq chains :2 250.0 200.0 50.0 00.0 50.0 00 2500 5000 7500 0000 iteration

Cas Pratique Résultats a posteriori Density : Densité a posteriori 0.4 0.3 0.2 0. 0.0 mu chains :2 sample: 20000 95.0 00.0 05.0 Quantiles :

Bgr diag : Calcule la stat. de Gelman-Rubin. Cas Pratique Résultats a posteriori Convergence si R<.05 et stabilité autour de. B et W doivent aussi s être stabilisés Auto corr : Fonction d auto corrélation de la variable avec un lag-50. Solution si auto corrélé : augmenter l épaisseur d échantillonnage (thin)

Cas Pratique Résultats a posteriori Stats : Statistiques descriptives de la loi a posteriori node mean sd MC error 2.5% median 97.5% start sample mu 02.9.232 0.008973 00.5 02.9 05.4 00 20000 sigmasq 4.5 9.4 0.295 82.79 2.3 58.0 00 20000 Coda : Valeurs des chaines en sortie texte pour analyser la convergence avec R (package Coda voir lundi 2/2/)

Cas Pratique Résultats a posteriori DIC : Deviance Information Criterion It is important to note that DIC assumes the posterior mean to be a good estimate of the stochastic parameters. If this is not so, say because of extreme skewness or even bimodality, then DIC may not be appropriate. Dbar = post.mean of -2logL; Dhat = -2LogL at post.mean of stochastic nodes Dbar Dhat pd DIC simul 567.309 565.290 2.08 569.327 total 567.309 565.290 2.08 569.327 Dbar: Moyenne a posteriori de la deviance définie comme -2 * log(likelihood): 'likelihood' est calculée par p( y theta ). Dhat: Estimation ponctuelle de la déviance. Obtenu en substituant theta par sa moyenne a posteriori. Dhat = -2 * log(p( y theta.bar )). pd: Nombre effectif de paramètres. pd=dbar-dhat DIC = Dbar + pd = Dhat + 2 * pd Plus le DIC est petit plus le modèle est le meilleur prédicteur pour un jeux de données de la même structure.

Scripts Fonctionnalité avancées

Winbugs et autres logiciels Des communications depuis d autres logiciels sont possibles, soit : - Pour analyser les résultats - Pour lancer Winbugs depuis une autre interface - Pour se substituer à Winbugs R Coda (Plummer et al.) Diagnostic de convergence Brugs, JAGS (interfacé avec C), R2WinBugs SAS Macro SAS (Hayat et al., Zhang et al. )

Partie II Régression linéaire simple

Modèle de Régression Linéaire Objectif : Expliquer le poids de cochon d élevage en fonction de leur âge et du nombre de ration de nourriture journalière. Cochon 2 3 4 5 6 7 8 9 0 Poids en kg (P) 85 2,5 94,5 23,5 07 85 0 40 0,5 99,5 Ration/Jour (R) 4 3 3 2 4 3 2 2 4 3 Age en mois (A) 43 9 60 57 9 4 85 20 49 69 p i = β a p i i ~ + β r 2 N( β a + ε ; i ε ~ N(0, τ ) i i i i + β r 2 =,...,0 i, τ )

A faire en WinBUGS et R Approche Bayésienne (WinBUGS) Ecrire et «Check model» (spécification et a priori) Charger les données Compiler et initialiser le modèle : Nombre de chaînes MCMC Valeurs initiales Simuler la phase de chauffe Entrer les paramètres à échantillonner Lancer l échantillonnage pour générer la loi a posteriori Vérifier la convergence Afficher les résultats Approche Fréquentiste (R) Comparaison des deux approches

Code WinBUGS et R Approche Bayésienne (WinBUGS) model{ for (i in :N){ p[i]~dnorm(mu[i],tausq) mu[i] <- beta*a[i]+beta2*r[i] } #A priori beta~dnorm(0,0.000) beta2~dnorm(0,0.000) tausq~dgamma(0.00,0.00) # Variable d'intérêt sigmasq<-/tausq } Approche Fréquentiste (R) #DATA list(n=0,p=c(85,2.5,94.5, 23.5,07,85,0,40,0.5, 99.5),r=c(4,3,3,2,4,3,2,2,4,3), a=c(43,9,60,57,9,4, 85,20,49,69)) #INITS list(beta=0,beta2=0, tausq=) #INITS list(beta=4,beta2=4, tausq=4) lmall<-lm(p~r+a-) summary(lmall) P<c(85,2.5,94.5,23.5,07,85,0,40,0.5,99.5) R<-c(4,3,3,2,4,3,2,2,4,3) A<-c(43,9,60,57,9,4,85,20,49,69)

Résultats Approche Bayésienne (WinBUGS) convergence OK. Approche Fréquentiste (R)

Nouveau modèle de régression p = β a + ε ; i =,...,0 i p ε ~ N(0, τ ) i i i ~ i N( β a i, τ ) Approche Bayésienne (WinBUGS) Convergence OK Approche Fréquentiste (R)

Courbes de prédiction

Courbes de prédiction Il est aussi possible de récupérer : Les résidus Les empirical Bayes pour les variables avec des effets aléatoires MSE

Partie III Modèle mixte (Albi)

ALBI

ALBI

ALBI

Data_albi.xls et albi_winbugs.txt ALBI

: d4t+ddi 2 : Switch 3 : AZT+3TC ALBI : variables disponibles

Modèle à intercept aléatoire Temps discret (0 jours, 30 jours, 60 jours,,80 jours) y = β0 + βt j + 0i + ε ( 2 ) 0i ~ N 0, σ ( ) 0 2 ε ~ N 0, σ ε Temps continu (... 0 0n) ( ε... ε n ) y = β0 + βt + 0 i + ε y = 4 CD4 ( 2 ) 0i ~ N 0, σ ( 2 ~ 0, ) 0 ε N σε (... 0 ) ( 0 n ε... εn) y = 4 CD4

Modèle à intercept aléatoire (temps discret) Temps discret # Definition du modele model { for(i in : N) { for(j in : T) { CD4t[i, j] ~ dnorm(mu[i,j], tau.eps); mu[i,j] <- beta0 + beta*tps[j]+gamma0[i] } gamma0[i] ~ dnorm(0.0,tau.gamma0) } # priors: beta0 ~ dnorm(0.0,.0e-4) beta ~ dnorm(0.0,.0e-4) tau.eps ~ dgamma(.0e-3,.0e-3) var.eps <-.0/tau.eps tau.gamma0 ~ dgamma(.0e-3,.0e-3) var.gamma0 <-.0 /tau.gamma0 }

Modèle à intercept aléatoire (temps discret) Temps discret list( N=49, T=7, CD4t = structure(.data = c(4.007789756,4.44399777,...,na,...,4.820570537),.dim = c(49,7)), tps = c(0,0.30,0.60,0.90,.20,.50,.80))

Modèle à intercept aléatoire (temps discret) Temps discret

Temps discret Modèle à intercept aléatoire SAS - proc MIXED (temps discret)

Modèle à intercept aléatoire (temps continu) Temps continu # Definition du modele model { for(i in : N) { for(j in : T) { CD4t[i, j] ~ dnorm(mu[i,j], tau.eps); mu[i,j] <- beta0 + beta*tps[i,j] + gamma0[i] } gamma0[i] ~ dnorm(0.0,tau.gamma0) } # priors: beta0 ~ dnorm(0.0,.0e-4) beta ~ dnorm(0.0,.0e-4) tau.eps ~ dgamma(.0e-3,.0e-3) var.eps <-.0/tau.eps tau.gamma0 ~ dgamma(.0e-3,.0e-3) var.gamma0 <-.0 /tau.gamma0 }

Modèle à intercept aléatoire (temps continu) DATAS (temps continu) list( N=49, T=7, CD4t = structure(.data = c(4.007789756,4.44399777,...,na,...,4.820570537),.dim = c(49,7)), tps = structure(.data = c(0,0.28,0.56,0.85,,.8),.dim = c(49,7)))

Modèle à intercept aléatoire (temps continu) Temps continu

Temps continu Modèle à intercept aléatoire SAS - proc MIXED (temps continu)

Modèle à intercept et pente aléatoires ( ) = = + + + + = 4 2 2 2 0 0 4 )... ( )... ( 0, ~ 0 0, 0 0 ~ 0 n n i oi i i i CD y N N t t y ε ε σ ε σ σ ε β β ε

Modèle à intercept et pente aléatoires # Definition du modele model { for(i in : N) { for(j in : T) { CD4t[i, j] ~ dnorm(mu[i,j], tau.eps); mu[i,j] <- beta0 + beta*tps[i,j]+ gamma0[i] + gamma[i]* tps[i,j] } gamma0[i] ~ dnorm(0.0,tau.gamma0) gamma[i] ~ dnorm(0.0,tau.gamma) } # priors: beta0 ~ dnorm(0.0,.0e-4) beta ~ dnorm(0.0,.0e-4) tau.eps ~ dgamma(.0e-3,.0e-3) var.eps <-.0/tau.eps tau.gamma0 ~ dgamma(.0e-3,.0e-3) var.gamma0 <-.0 /tau.gamma0 tau.gamma ~ dgamma(.0e-3,.0e-3) var.gamma <-.0 /tau.gamma }

Modèle à intercept et pente aléatoires

Modèle à intercept et pente aléatoires : SAS proc MIXED 0.2983 0.0750 0.2083

Modèle à intercept et pente aléatoires avec matrice de variance-covariance structurée ( ) = = + + + + = 4 2 2 2 0 0 4 )... ( )... ( 0, ~, 0 0 ~ 0 0 0 n n i oi i i i CD y N N t t y ε ε σ ε σ σ σ σ ε β β ε

Modèle à intercept et pente aléatoires avec matrice de variance-covariance structurée # Definition du modele model { for(i in : N) { for(j in : T) { CD4t[i, j] ~ dnorm(mu[i,j], tau.eps); mu[i,j] <- beta0 + beta*tps[i,j] +gamma[i,]+gamma[i,2]*tps[i,j] } gamma[i,:2] ~ dmnorm(null[:2], tau.gamma[,]) } # priors: beta0 ~ dnorm(0.0,.0e-4) beta ~ dnorm(0.0,.0e-4) tau.eps ~ dgamma(.0e-3,.0e-3) sigma.eps <-.0/tau.eps tau.gamma[:2, :2] ~ dwish(omega[,], 2) var.gamma[:2, :2] <- inverse(tau.gamma[,]) var.gamma0 <- var.gamma[,] var.gamma <- var.gamma[2,2] cov.gamma <- var.gamma[,2] }

Modèle à intercept et pente aléatoires avec matrice de variance-covariance structurée

Modèle à intercept et pente aléatoires : SAS - proc MIXED 0.2938 0.0469 0.0708 0.2088

Modèle à intercept et pente aléatoires : Courbes mu 0.2938 0.0469 0.0708 0.2088 CD4

Prise en compte d un effet traitement (AZT+3TC=référence) ( ) = = + + + + + + + + = = + = 4 2 2 2 0 5 4 4 3 2 0 4 )... ( )... ( 0, ~, 0 0 ~ ) ( ) ( 0 0 0 n n i oi i i i switch trt ddi t d trt CD y N N t t t t y ε ε σ ε σ σ σ σ ε β β β β β β ε

Prise en compte d un effet traitement (AZT+3TC=référence) model { for(i in : N) { for(j in : T) { mu[i,j] <- beta0+beta*tps[i,j] + (beta2+beta3*tps[i,j])*(equals(grp[i],) + (beta4+beta5*tps[i,j])*(equals(grp[i],2) + gamma[i,] + gamma[i,2]*tps[i,j] } } d4t+ddi Switch # priors: beta2 ~ dnorm(0.0,.0e-4) beta3 ~ dnorm(0.0,.0e-4) beta4 ~ dnorm(0.0,.0e-4) beta5 ~ dnorm(0.0,.0e-4) }

Prise en compte d un effet traitement (AZT+3TC=référence)

Prise en compte d un effet traitement (AZT+3TC=référence)

Prise en compte d un effet traitement : SAS - proc MIXED

Modèle similaire pour la CHARGE VIRALE ( ) = = + + + + + + + + = = + = ) ( log )... ( )... ( 0, ~, 0 0 ~ ) ( ) ( 0 2 2 2 0 5 4 4 3 2 0 0 0 0 n n i oi i i i switch trt ddi t d trt CV y N N t t t t y ε ε σ ε σ σ σ σ ε β β β β β β ε

Modèle similaire pour la CHARGE VIRALE CV Temps

Modèle similaire pour la CHARGE VIRALE

Modèle similaire pour la CHARGE VIRALE avec censure ( ) = = + + + + + + + + = + = + = ] [.69; 0 2 2 2 0 5 4 4 3 2 0 ) ( log )... ( )... ( 0, ~, 0 0 ~ ) ( ) ( 0 0 0 n n i oi i i i switch trt ddi t d trt CV y N N t t t t y ε ε σ ε σ σ σ σ ε β β β β β β ε

Modèle similaire pour la CHARGE VIRALE avec censure model { for(i in : N) { for(j in : T) { CV[i, j] ~ dnorm(mu[i,j], tau.eps)i(.699,) mu[i,j] <- beta*tps[i,j] + (beta2+beta3*tps[i,j])*(equals(grp[i],) + (beta4+beta5*tps[i,j])*(equals(grp[i],2) + gamma[i,] + gamma[i,2]*tps[i,j] } } # priors: eft ~ dnorm(0.0,.0e-4) eft2 ~ dnorm(0.0,.0e-4) }

Modèle similaire pour la CHARGE VIRALE avec censure

Partie IV Diagnostiques de convergence CODA

Diagnostic de convergence (CODA) http://www.people.fas.harvard.edu/~plam/teaching/methods/convergence/convergence_print.pdf On reprend l exemple : Albi - Modèle à intercept et pente aléatoires avec matrice de variance-covariance structurée Récupérer les fichiers Coda sous WinBUGS index.txt, chaine.txt, chaine2.txt Code R pour Coda setwd(«monrepertoire\\») library(coda) codamenu()

Diagnostic de convergence (CODA) : Output Analysis 2: Diagnostics 3: List/Change Options 4: Quit : Plots 2: Statistics 3: List/Change Options 4: Return to Main Menu

Diagnostic de convergence (CODA) : Output Analysis 2: Diagnostics 3: List/Change Options 4: Quit : Geweke 2: Gelman and Rubin 3: Raftery and Lewis 4: Heidelberger and Welch 5: Autocorrelations 6: Cross-Correlations 7: List/Change Options 8: Return to Main Menu

Diagnostic de convergence (CODA) Test de Geweke : teste l égalité des moyennes entre la première partie de la chaîne (0%) et la fin de la chaîne (50%) grâce au Z-score. Geweke-Brooks plot : Graphique montrant les valeurs de la statistique de test du Z-score pour la comparaison des moyennes entre diverses répartitions. z = µ µ fin σ deb ( 0 H ~ ) N(0,)

Diagnostic de convergence (CODA)

Diagnostic de convergence (CODA) Gelman and Rubin : Calcul du facteur d échelle de réduction pour la chaîne moins les n/2 premiers éléments. Evalue la stationnarité (doit être inférieur à.-.2) shrink factor = Estimated varianceof parameter Within varianceof the chain for the parameter

Diagnostic de convergence (CODA)

Diagnostic de convergence (CODA) Raftery and Lewis: Teste le nombre d itérations de chauffe et d échantillonage nécessaire pour avoir une estimation d un quantile q avec une tolerance r. M : Nombre d itération en phase de chauffe N : Taille du pilot sampler à générer Nmin : Nombre d itération en phase d échantillonage I : Facteur d indépendance, augmentation proportionnelle des itération attribuable à la dépendance dans la série. I>5 : «inquiétant». Montre: - mauvais point de départ - pauvre mélangeance - grande corrélations

Diagnostic de convergence (CODA) Heidelberger and Welch : Test statistique de stationnarité de la chaîne de Markov. Etape : Test itératif pour savoir si la chaîne est issue d une loi stationnaire. Etape 2: Halfwidth test, vérification de la taille du ratio entre la moitié de la longueur de l intervalle de crédibilité à (-α)% et la moyenne a posteriori.

Diagnostic de convergence (CODA) Autocorrélation : Une grande autocorrélation indique une mélangeance lente et donc une convergence de la chaîne vers la distribution invariante lente.

Diagnostic de convergence (CODA) Changer l épaisseur d échantillonnage peut être une solution pour réduire l autocorrélation sans forcément réduire l information.. : Output Analysis 2: Diagnostics 3: List/Change Options 4: Quit : List current options 2: Data Options 3: Plot Options 4: Summary Statistics Options 5: Diagnostics Options 6: Output Analysis 7: Diagnostics 8: Main Menu : List current data options 2: Select variables for analysis 3: Select chains for analysis 4: Select iterations for analysis 5: Select thinning interval (METTRE A 0) 6: Return to main options menu

Cross Corrélation :Renvoie la matrice de corrélation des variables estimées par les chaîne MCMC. Diagnostic de convergence (CODA)

Partie V Construction de Doodle (DAG)

Doodles Les Doodles Winbugs sont des DAGs, Directed Acyclic Graphs. Ils permettent de représenter graphiquement un système d équation de définition d un modèle. Leur dessin peut paraitre plus simple que la spécification par programmation du modèle. (Write Code) Comment faire? (Menu Doodle / Help->Doodle help) - Assiette : ctrl + clic gauche - Nœud : clic gauche (type de nœud (stochastique, logique ou constant), type de loi, censure ) - Arrête : Sélectionner le nœud cible. Appuyer sur contrôle, cliquez sur le nœud de provenance de la flèche. (idem pour supprimer) - Suppression : ctrl+backspace

Rats: a normal hierarchical model