决策问题的分类与决策原则.doc

上传人:scccc 文档编号:12480102 上传时间:2021-12-04 格式:DOC 页数:19 大小:675KB
返回 下载 相关 举报
决策问题的分类与决策原则.doc_第1页
第1页 / 共19页
决策问题的分类与决策原则.doc_第2页
第2页 / 共19页
决策问题的分类与决策原则.doc_第3页
第3页 / 共19页
亲,该文档总共19页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

《决策问题的分类与决策原则.doc》由会员分享,可在线阅读,更多相关《决策问题的分类与决策原则.doc(19页珍藏版)》请在三一文库上搜索。

1、第四章贝叶斯分析Bayesean Analysis§ 4.0 引言一、决策问题的表格表示损失矩阵对无观察 (No-data)问题a= 可用表格 (损失矩阵 )替代决策树来描述决策问题的后果(损失 ):a1a jam ( 1 )l 11l 1 jl 1m ( i )l i1l ij ( n )l m1lnm或( 1 )( i )( n )a1l 11l 1il1 na jl ija ml m1l mn损失矩阵直观、运算方便二、决策原则通常,要根据某种原则来选择决策规则,使结果最优 (或满意 ),这种原则就叫决策原则,贝叶斯分析的决策原则是使期望效用极大。本章在介绍贝叶斯分析以前先介绍芙

2、他决策原则。三、决策问题的分类:1. 不确定型 (非确定型 )自然状态不确定,且各种状态的概率无法估计.2. 风险型自然状态不确定,但各种状态的概率可以估计.四、按状态优于:l ij likI, 且至少对某个i 严格不等式成立, 则称行动 a j 按状态优于a k§ 4.1不确定型决策问题一、极小化极大(wald) 原则 (法则、准则 ) a 1 a 2a4min maxl (i,a j )或maxmin uijjiji例 :a 1a 2a3a411087924192341316121469810各行动最大损失 :13161214其中损失最小的损失对应于行动a3 .采用该原则者极端保

3、守,是悲观主义者 , 认为老天总跟自己作对 .二、极小化极小min min l (i, a j )或 maxmax uijjiji例 :a 1a 2a3a411087924192313161214469810各行动最小损失 :4172其中损失最小的是行动a 2 .采用该原则者极端冒险,是乐观主义者,认为总能撞大运。三、 Hurwitz准则上两法的折衷,取乐观系数入min minl (i,a j )( 1 maxl (i,a j )jii例如 =0.5时 min lij :20.53.51i( 1 max lij: 6.5867i两者之和:8.58.59.58其中损失最小的是:行动a 4四、等概

4、率准则 (Laplace)用l ij 来评价行动a j 的优劣i选 minlijji上例:l ij : 3334 36 35其中行动a1 的损失最小i五、后梅值极小化极大准则(svage-Niehans)定义后梅值sij = lij - minl ikk其中 min l ik 为自然状态为i 时采取不同行动时的最小损失 .k构成后梅值 (机会成本 )矩阵S= sij m n ,使后梅值极小化极大,即 :min max sijji例 : 损失矩阵同上, 后梅值矩阵为 :3102308114020324各种行动的最大后梅值为:3484其中行动 a 1 的最大后梅值最小, 所以按后梅值极小化极大准则

5、应采取行动1.六、 Krelle准则:使损失是效用的负数(后果的效用化),再用等概率 (Laplace) 准则 .七、莫尔诺 (Molnor)对理想决策准则的要求(1954)1. 能把方案或行动排居完全序;2. 优劣次序与行动及状态的编号无关;3. 若行动a k 按状态优于a j ,则应有a k 优于 a j;4. 无关方案独立性:已经考虑过的若干行动的优劣不因增加新的行动而改变;5. 在损失矩阵的任一行中各元素加同一常数时,各行动间的优劣次序不变;6. 在损失矩阵中添加一行,这一行与原矩阵中的某行相同,则各行动的优劣次序不变。§ 4.2 风险型决策问题的决策原则一、最大可能值准则令

6、 (k )=max (i )选a r 使 l(k , a r )= min l(k , a j )j例:12( i )a 1a2a 30.276.560.534530.3410 ( 2) 概率最大 , 各行动损失为 345应选行动 a1二、贝叶斯原则使期望损失极小:min l(i,a j ) (i ) ji上例中 ,各行动的期望损失分别为4.13.63.7,对应于 a 2 的期望损失3.6 最小应选 a 2 .三、贝努利原则损失函数取后果效用的负值,再用 Bayes原则求最优行动.四、 E V( 均值方差 )准则若 El ij E lik且jk 则 a j 优于 ak通常不存在这样的 a j上

7、例中 :a 1a2a 3E4.13.63.7V(2 )2.293.795.967不存在符合EV 准则的行动 ,这时可采用 f( , )的值来判断 ( 为效益型后果的期望 ) - f( , )= - 2 - ( 2 + 2 )f 越大越优 .五、不完全信息情况下的决策原则(Hodges-Lehmann原则 )状态概率分布不可靠时, 可采用: ( a j )=uij i + min uiji=1,2,mj=1,2, ,nii 越大越优 .§ 4.3 贝叶斯定理一、条件概率1.A 、 B 为随机试验E 中的两个事件P(A B)=P(AB)/P(B)由全概率公式:A jj=1,2,n是样本空

8、间的一个划分,P(B)=P(B|A j )P( A j )j得 Bayes 公式P( Ai |B)=P(B|Ai )· P( Ai )/P(B)= P(B|Ai )· P( Ai )/P(B|A j )P( A j )j2.对 , 两个随机变量·条件概率密度f( | x)=f(x | )f( )/f(x)·在主观概率论中 ( | x)=f(x | ) ( )/m(x)其中: ( )是 的先验概率密度函数f(x )是 出现时, x 的条件概率密度,又称似然函数.m(x) 是 x 的边缘密度 , 或称预测密度.m(x)=f(x | ) () d 或p(x|i

9、 ) ( i )i ( x)是观察值为x 的后验概率密度。例: A 坛中白球 30% 黑球 70%B 坛中白球 70% 黑球 30%两坛外形相同,从中任取一坛,作放回摸球12 次 , 其中白球4 次,黑球8 次,求所取为A坛的概率 .解:设观察值4 白 8黑事件为x,记取A 坛为1, 取B坛为2在未作观察时,先验概率p(1 )=p(2 )=0.5则在作观察后,后验概率P(1 |x)=p(x|1 )p(1 )p(x|1 )p(1 )+p(x|2 )p(2 )= 034×07.8×0.5( 03.4× 07.8× 0.5+07.4× 03.8

10、15; 0.5).= 0.74(07.4×03.4)=0.24010.2482=0.967显然 , 通过试验、观察、可修正先验分布.§ 4.4贝叶斯分析的正规型与扩展型一、正规型分析由 Baysean原则:先验分布为( )时,最优的决策规则是贝叶斯规则, 使贝叶斯风险r( ,)= infr( , (x)其中:r( , (x)=ER( , (x)= E E xl( , (x)=l( ,(x) f(x | )dx( ) d (1)x据 (1) 式,选使 r( , )达到极小,这就是正规型的贝叶斯分析。在解实际问题时,求使 (1) 式极小的 (x) 往往十分困难,尤其在状态和观察

11、值比较复杂时,集中的策略数目很大,穷举所有的(x)有困难,且计算量颇大。实际上可用下法:二、扩展型贝叶斯分析(Extensive Form Analysis)在 (1) 式中因 l( , )>- , f(x ), ()均为有限值。由 Fubini 定理,积分次序可换即 r( ,(x)=l( , (x) f(x | )dx ( ) d x=l( , (x) f(x | )( ) d dx(2)x显然,要使 (2) 式达到极小,应当对每个x X ,选择 ,使l( , (x) f(x | ) ( ) d ( 2 )为极小 (x)=a若对给定的 x, 选 a ,使l( , (x) f(x | )

12、 ( ) d 为极小亦即,使1l( ,a) f(x |) () d m( x)=l( i ,a) (i |x) d 或l( i ,a)p( i|x)(3) 达极i小,即可使 (1) 式为极小 .·结论:对每个 x ,选择行动 a ,使之对给定 x 时 的后验分布 ( x) 的期望损失为极小,即可求得贝叶斯规则。这种方法叫贝叶斯分析的扩展型,由此确定的贝叶斯规则叫formal Bayesean Rule Raiffa Sehlaifer,1961年提出。· Note·使 (3) 式达极小的行动可能不只一个,即可能有多个贝叶斯规则;·扩展型比正规型更直观,也

13、容易计算,故更常用;·许多分析人员只承认扩型,理由是:i ,( x)描述了试验后的的分布, 比 ( )更客观, 因此,只要损失函数是由效用理论导出的 (即考虑了DMer的价值判断、 风险偏好 ),在评价行动a 的优劣时就应当用后验期望损失。ii,r( , )是根据 ()求出的,而用先验分布( )来确定行动a 并不一定适当。从根本上讲,这种观点是正确的。·无论从何种观点来进行贝叶斯分析,从理论上讲,结果是一样的,所以采用何种方法可视具体问题,据计算方便而定。·已经证明, 形式贝叶斯分析对一类非随机性决策规则是成立的,也可以证明它对随机性决策规则同样成立。使所有x 上

14、后验期望损失极小的贝叶斯规则也是随机性规则集*中的Bayes规则,因此,总可以找到一验期望损失极小的非随机性规则。三、例 (先看无观察问题)农民选择作物问题,设某地旱年1 占 60% ,正常年景2 占 40%;a1 种植耐旱作物a 2 种不耐旱作物,后果矩阵为:a1a21200260100决策人的效用函数u(y)=1(1- e 0.02 y )0.865解: i 令: l(y)=1-u(y)ii, 作决策树:( 1 )a1( 2 )( 1 )a2niii, 在无观察时 , R=l,r=l( i ,a) (i )11r( , a 1 )=l(1 , a1 ) ( 1 )+l(2 , a1 ) (

15、 2 )=0.62× 0.6+0.19× 0.4=0.448r( ,a 2 )= l(1 , a 2 ) (1 )+l(2 , a 2 )(2 )=1.0× 0.6+0×0.4yul20 .38 .6260 .81 .1900110010=0.6风险 r 小者优 , = a 1 ,是贝叶斯规则, 即贝叶斯行动. 即应选择耐旱作物。四、例 (续上 )设气象预报的准确性是0.8 ,即 p( x1 |1 )=0.8p( x2 |2 )=0.8其中, x1 预报干旱x2 预报正常年景则m( x1 )=p( x1 |1 ) (1 )+p(x1 |2 ) (2 )=

16、0.8× 0.6+0.2× 0.4=0.56m( x2 )=0.44 (1 | x1 )=p( x1 |1 )( 1 )m( x1 )=0.8×0.6 0.56=0.86 (1 | x2 )=p( x2 |1 ) ( 1 )m( x2 )=0.2×0.6 0.44=0.27 ( 2 | x1 )=0.14 ( 2 | x2 )=0.73 1.正规型分析策略1 :a1 =1 ( x1 )a 2 =1 ( x2 )r( ,1 )=l (i ,1 ( x j)p( x j|i) (i )ij4-7= l (1 , a1 )p(x1 |1 ) (1 )+l (1

17、 , a 2 )p(x2 |1 ) ( 1 )+ l (2 , a1 )p( x1 |2 ) (2 )+l (2 , a2 )p(x2 |2 )(2 )=0.62×0.8 × 0.6+1.0× 0.2 ×0.6+0.19×0.2 × 0.4+0.0 × 0.8 ×0.4=0.4328策略2 :a1 =2 ( x2 )a2 =2 ( x1 )r( ,2 )=l (i ,2( x j )p(x j|i ) (i)ij=l (1 , a1 )p(x2 |1 ) (1 )+l (1 , a 2 )p(x1 |1 ) (1

18、)+ l (2 , a1 )p(x2 |2 ) (2 )+l (2 , a 2 )p( x1 |2 ) (2 )= 0.62 ×0.2 × 0.6+1.0 × 0.8 ×0.6+0.19 × 0.8 × 0.4+0.0 × 0.8 × 0.4 =0.6152策略3:a 1 =3 ( x1 )a1 =3 ( x2 )r( ,3 )=0.45策略 4:a 2 =4 ( x1 )a 2 =4 ( x2 )r( ,4 )=0.6 r( ,1 ) r( ,3 ) r( ,4 ) r( ,2 )13421 是贝叶斯行动。( 1

19、1 | x 11)a 1( 2 | x 1)a 2(1 | x1 )x 1(2 | x 1 )(1 |x 2 )x 21( 2 |x 2 )a 1( 1 | x 2 )a 2(2 | x 2 )482.扩展型之一:据(2) : l( , (x) f(x | ) () d记作r 给定x1 (预报干旱):采用a1r =l (i , a1 )p( x1 |i ) (i )i= l (1 , a 1 )p( x1 |1 ) (1 ) + l (2 , a 1 )p( x1 |2 )(2 )= 0.62×0.8×0.6+0.19×0.2× 0.4=0.3128采用

20、 a 2r = l (1 , a 2 )p( x1 |1 ) (1 ) + l (2 , a2 )p( x1 |2 ) (2 )=0.48风险小者优给定 x1 应选 a1给定 x2 (预报天气正常)采用 a 1r = l (1 , a1 )p( x2 |1 ) (1 ) + l (2 , a1 )p( x2 |2 )(2 )=0.62 × 0.2 × 0.6 + 0.19× 0.8 × 0.4=0.135采用 a 2r = l (1 , a 2 )p( x1 |1 ) (1 ) + l (2 , a 2 )p( x1 |2 ) (2 )=1.0 

21、5;0.2 × 0.6 + 0=0.12给定 x2 应选 a 2由此得形式Bayes规则:a1 =( x1 )a2 =( x2 )3. 扩展型之二:据(3) 式 即l(i ,a) ( i |x)d 或l(i ,a) ( i |x)( 记作ir ”)给定 x1 ,采用 a 1r ” =l(i , a1 ) (i | x1 )i= l(1 , a 1 ) ( 1 | x1 ) + l(2 , a 1 ) ( 2 | x1 )=0.62× 0.86 + 0.19× 0.14=0.56采用 a 2r ” = l( 1 , a 2 )(1 | x1 ) + l(2 , a

22、2 ) ( 2 | x1 )= 1.0×0.86+ 0 × 0.14=0.86给定 x1 ,应选行动a1 .给定 x2采用 a1r ” =l( i , a1 ) ( i | x2 )i= l( 1 , a1 ) ( 1 | x2 ) + l( 2 , a 1 ) ( 2 | x2 )=0.62× 0.27 + 0.19× 0.73 = 0.3061采用 a 2r ” =l( i , a 2 )( i | x2 )i= l(1 , a 2 )(1 |x2 ) + l(2 , a2 ) (2 |x2 )=1.0×0.27 + 0× 0.7

23、3 =0.27给定x2应选择行动a 2 .形式 Bayes 规则:a1 =( x1 )a 2 =( x2 )§ 4.5非正常先验与广义贝叶斯规则一、非正常先验(Improper Prior)概率测度的三个条件:i, 规范性: P()=1ii, 非负性: 0 P(A) 1iii, 可列可加性在设定先验分布时,若不满足规范性,则称为非正常先验.二、广义贝叶斯规则(General Bayesean Rule)1. 定义:决策问题的损失函数为l( ,a) , ( )为非正常先验分布,对给定的i ,使i,l( , (x) f(x | )( ) d 为极小,或者ii, 0 m(x) 时 ,使l(

24、i ,a) (i |x) d 为极小的策略 (行动 ),构成广义贝叶斯规则 .2.Nole :在许多重要场合,所有允许的都是GBR在无法得到正常先验时,除此别无良策;GBR 不一定是最好的决策规则§ 4.6一种具有部分先验信息的贝叶斯分析法一、概述1. 思路:在部分先验信息难以唯一地确定 ()时,抛开唯一性要求,转而确定与已知先验信息相符的先验分布的集。2. 符号i, 和 A 为有限集:=1 ,2 ,n A= a1 , a 2 , am 损失矩阵L= lij n ml ij =l (i , a j )ii, 根据贝叶斯分析的扩展型给定 x,应从集合 A 中选一行动ak ,使q(a)=

25、l ( i,a) p(x1 |i)(i ) 为极小 ,亦即iak = arg min q(a)或q( a k ) q( a j )j=1,2, ,m(4)a A则 a k 为贝叶斯行动 .记 p( x1 |i )为 pi (x), (i )为iL k = l1k , l 2 k , , lnk T = 1 , 2 , , n 则l (i ,a) p(x1 |i )(i )=LTdiagpi (x) ji(4) 式可表示成L Tk diagp (x) LTjdiagp(x) i=1,2,n(5)iij=1,2,m(5) 式即 (LT -1 L T ) diagp (x) 0(5 )ki记 (L

26、T - 1 L kT ) diagpi (x) 为 D k(x), 式 (5 )可表示为 :D k (x) 0(5 ”)3. (5 ” ) 式的含义(1) 给定 x ,先验分布为 时,应选 a k 使 5( 即 5 , 亦即 5 ” ) 式成立。(2) 对给定的 x,要使ak 成为贝叶斯行动, 应满足5( 即 5 , 亦即 5 ” ) 式.由 (2) 可以定义k (x)= | D k (x) 0 ;ii1,i 0 式中 ,是先验分布的所有可能的集,k (x)是 的一个子集,它能i, 使对给定x 为Bayes行动ii, 满足规范性和非负性二、分析步骤1.确定k (x)2. 确定先验信息对先验分布

27、 ( )的约束:Q= | A 0,ii1,i 0式中 , A 0是先验信息对先验分布()的约束 .3. 结论:当k (x) 与 Q 有非空交集时, ak 为 Bayes 行动 .三、例已知: i, Q= |1 0.5 ,23 ,3 10 4 ,ii1ii, 由已往的统计资料,三种病患者的白血球计数:f(x|1 )= N( 3000,10002)f(x|2 )= N( 3000, 10002)f(x|3 )= N( 3000,10002)iii, 观察: x=5000要求判定:患者得什么病解: p(x| 1 )= p(5000|1 )50501( x) 2*x1e22=2dx令 x=495011

28、2.051ex*22dx=1.952=0.9798 - 0.9744 = 0.0054同理可得 :p(x|2 )=0.0091p(x|3)=0.00001050111011 L= 101, 1 l1T = 10110111101011000, L T -1 l1T = 11 0 ,1015.410110000diag pi (x)= 019. .1110D1= 5.49.100101017.5.40.01700D 1 (5000) · 0即 5.419.1 2 05.40017.301 (5000)= |1 -1.69 2 0, 1-0.003153 0,i i1同理可得2(5000) 和3 (5000)三、几何意义1.由ii12.Q:由先验信息确定红框内为Q3. 从 D k (x) 0得1,2,3.

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 社会民生


经营许可证编号:宁ICP备18001539号-1