Stratégies de décision Arbres Décision/Hasard

Stratégies de décision Arbres Décision/Hasard Ecole Centrale Paris, vincentmousseau@ecpfr June 15, 2009

1 Introduction 2 3 4 5 additionnelle parfaite 6

Introduction Il est souvent nécessaire de modéliser des séquences de décisions et d événements exogènes (hasard) La modélisation par arbre décision/hasard permet la comparaison de scenarii face à un problème de décision donné Dans un arbre de décision/hasard, un scenario (séquence de choix/événements) est représenté par une branche de l arbre Un arbre Décision/hasard comporte deux types de noeuds: Noeud décision ( ) symbolise un choix, Noeud hasard ( ) symbolise des événements pouvant survenir

Un premier exemple simple : forage pétrolier On considère une campagne de forage pétrolier sur une zone donnée Sur chaque site de forage potentiel de la zone, on peut choisir de forer (ou non) Selon le niveau des réserves sur chaque site, les résultats de l exploitation varient : réserves nulles exploitation nulle, réserves limitées exploitation faible, réserves élevées exploitation forte,

Introduction exploitation forte développer exploitation faible exploitation nulle ne pas développer exploitation nulle

Un premier exemple simple : forage pétrolier Selon les résultats d exploitation, les outcomes sont : exploitation nulle -500, exploitation faible 250, exploitation forte 400, 400 développer ne pas développer exploitation forte exploitation faible exploitation nulle 250-500 exploitation nulle 0 La théorie de la décision vise à donner des éléments pour choisir parmi des scenarii

Forage pétrolier : poursuite de l exemple Il est possible d effectuer un sondage sismique (coût : c s ) donnant des indications sur la nature des réserves en pétrole Les réponses du sondage peuvent être : s 1 : bon (réserves probablement abondantes), s 2 : mauvais (réserves probablement faibles), Notations S = {s 1,s 2 } signaux du sondage sismique A = {a 1,a 2 } décisions (a 1 : forer, a 2 : ne pas forer ) S = {e 1,e 2,e 3 } états de la nature : e 1 : beaucoup de pétrole, e 2 : peu de pétrole, e 3 : pas de pétrole

arbre de décision pas de sondage sondage forage pas de forage sondage bon sondage mauvais 0 expl forte expl faible expl nulle forage pas de forage forage pas de forage 400 250-500 c s c s expl forte expl faible expl nulle expl forte expl faible expl nulle 400 c s 250 c s 500 c s 400 c s 250 c s 500 c s

Max-Min (critère de prudence) Absence d information sur l occurrence des états de la nature On choisit la décision qui maximise le pire cas Conduit à choisir de ne pas effectuer le forage Espérance mathématique des gains (EMG) On dispose de probabilité d occurrence des états de la nature Soient les probabilités a priori p(e 1 ) = 043, p(e 2 ) = 03 et p(e 3 ) = 027 On maximise l EMG Conduit à choisir de développer le forage

L information véhiculée par le sondage affecte la décision On passe d une information a priori sur le gisement, p(e i ), i=1,2,3 à une information a posteriori, p(e i /s j ), i=1,2,3, j=1,2 Si le sondage est fiable, p(e i ) p(e i /s j )

La fiabilité du sondage est donnée par p(s j /e i ) p(s j /e i ) s 1 : bon s 2 : mauvais e 1 : beaucoup de pétrole 081 019 e 2 : peu de pétrole 060 040 e 3 : pas de pétrole 044 056

On peut calculer p(s 1 ) et p(s 2 ) p(s 1 ) = p(s 1 /e 1 )p(e 1 ) + p(s 1 /e 2 )p(e 2 ) + p(s 1 /e 3 )p(e 3 ) = 044 027 + 060 030 + 081 043 = 065 p(s 2 ) = p(s 2 /e 1 )p(e 1 ) + p(s 2 /e 2 )p(e 2 ) + p(s 2 /e 3 )p(e 3 ) = 056 027 + 040 030 + 019 043 = 035

arbre de décision pas de sondage sondage forage pas de forage sondage bon 065 035 sondage mauvais 0 expl forte 043 03 expl faible expl nulle 027 forage pas de forage forage pas de forage 400 250-500 c s c s expl forte expl faible expl nulle expl forte expl faible expl nulle 400 c s 250 c s 500 c s 400 c s 250 c s 500 c s

On cherche à calculer p(e i /s j ), Théorème de Bayes p(e i /s j ) = p(s j/e i )p(e i ) p(s j ) p(e 2 /s 1 ) = p(s 1/e 2 )p(e 2 ) p(s 1 ) = 06 03 065 = 028 p(e i /s j ) s 1 : bon s 2 : mauvais e 1 : beaucoup de pétrole 054 023 e 2 : peu de pétrole 028 034 e 3 : pas de pétrole 018 043

arbre de décision pas de sondage sondage forage pas de forage sondage bon 065 035 sondage mauvais 0 expl forte 043 03 expl faible expl nulle 027 forage pas de forage forage pas de forage 400 250-500 c s c s expl forte 054 028 expl faible expl nulle 018 expl forte 023 034 expl faible expl nulle 043 400 c s 250 c s 500 c s 400 c s 250 c s 500 c s

Résolution de l arbre sur la base de l EMG On associe aux arcs issus de noeud hasard ( ) les probabilités correspondantes On évalue l arbre en remontant des feuilles à la racine On remonte à un noeud hasard en calculant l EMG On remonte à un noeud décision par le maximum des évaluations des noeud fils

arbre de décision pas de sondage sondage 112 127-c s forage pas de forage sondage bon 065 035 sondage mauvais 112 0 196-c s -c s expl forte 043 03 expl faible expl nulle 027 forage pas de forage forage pas de forage 400 250-500 196-c s c s -38-c s c s expl forte 054 028 expl faible expl nulle 018 expl forte 023 034 expl faible expl nulle 043 400 c s 250 c s 500 c s 400 c s 250 c s 500 c s

additionnelle parfaite 1 Introduction 2 3 4 5 additionnelle parfaite 6

additionnelle additionnelle parfaite La valeur espérée du gain avec information à l origine v 0 est l espérance mathématique de la politique optimale, déterminée sans information additionnelle v 0 = 027 500 + 030 250 + 043 400 = 112 v a est la valeur espérée du gain avec info additionnelle (sans prendre en compte le coût d acquisition de cette info) v a = 065 196 + 035 0 = 127 v a v 0 est la valeur espérée de l info additionnelle v a v 0 = 127 112 = 15

parfaite additionnelle parfaite Soit v p la valeur espérée du gain en information parfaite L information parfaite (oracle) fournit toujours l état de la nature qui va survenir Si l oracle indique e 1, la décision est forer (400) Si l oracle indique e 2, la décision est forer (250) Si l oracle indique e 3, la décision est ne pas forer (0) d où v p = 043 400 + 030 250 + 027 0 = 247 Valeur espérée de l information parfaite : v p v 0 = 247 112 = 135 Efficacité de l information additionnelle va v 0 v p v 0 = 15 135 = 011

Le critère de l EMG ne traduit pas la manière avec laquelle le décideur appréhende le risque (compare des loteries) Le critère de l espérance mathématique de l utilité des gains (EMU) permet de modéliser des comportements variés face au risque Soit u(x) [0,1] une fonction d utilité qui représente pour le décideur la valeur subjective associée à la conséquence x On peut substituer dans la résolution d un arbre décision-hasard le critère de l EMU à l EMG

Reprenons l exemple du forage pétrolier et posons c s = 20 Sachant que la valeur de l information est 15, un décideur neutre vis-à-vis du risque ne sera pas intéressé par le sondage Un décideur averse au risque pourra au contraire être intéressé par ce sondage supposons que la fonction d utilité qui modélise l attitude face x+520 au risque du décideur soit : u(x) = 920 on notera que u( 520) = 0, u(400)=1 et que u est concave (aversion au risque)

Fonction d utilité 1 u(x) = x+520 920 0-520 -420-320 -220-120 -20 80 180 280 380 x

arbre de décision 077 pas de sondage sondage 075 077 forage pas de forage sondage bon 065 035 sondage mauvais 074 u(0) = 075 079 073 expl forte 043 03 expl faible expl nulle 027 forage pas de forage forage pas de forage u(400) = 1 u(250) = 091 u( 500) = 015 u(380) = 099 079 028 u(230) = 090 expl faible u( 520) = 0 u( 20) = 073 u(380) = 099 053 034 u(230) = 090 expl faible u( 520) = 0 u( 20) = 073 expl forte 054 expl nulle 018 expl forte 023 expl nulle 043

Attitude prudente Accepter le sondage malgré son coût élevé Préférer ne pas forer en l absence de l information du sondage