第八章随机性决策分析.ppt

上传人:本田雅阁 文档编号:3506193 上传时间:2019-09-05 格式:PPT 页数:106 大小:1.09MB
返回 下载 相关 举报
第八章随机性决策分析.ppt_第1页
第1页 / 共106页
第八章随机性决策分析.ppt_第2页
第2页 / 共106页
第八章随机性决策分析.ppt_第3页
第3页 / 共106页
第八章随机性决策分析.ppt_第4页
第4页 / 共106页
第八章随机性决策分析.ppt_第5页
第5页 / 共106页
点击查看更多>>
资源描述

《第八章随机性决策分析.ppt》由会员分享,可在线阅读,更多相关《第八章随机性决策分析.ppt(106页珍藏版)》请在三一文库上搜索。

1、第八章 随机性决策分析,第一节 随机性决策问题的基本特点 第二节 随机性决策问题的基本分析方法 第三节 不确定型决策方法 第四节 先验信息与主观概率 第五节 修正概率的方法贝叶斯公式的应用 第六节 效用理论在随机决策中的应用,要求掌握以下内容:,概念部分: 1. 随机性决策问题的特点 2. 解决随机性决策问题常用的决策原则 3. 不确定型决策准则 计算部分: 随机性决策问题的期望值最大原则、不确定型决策、贝叶斯决策法、期望效用决策法。,第一节 随机性决策问题的基本特点,一、决策问题的分类 从模型讨论的角度,依目标多少分类: 单目标决策 多目标决策 依自然状态的特性分类: 确定型 风险型 不确定

2、型,回本章目录,综合之,六种类型:,单目标确定型- -函数极值、线性规划 单目标风险型- -主观概率法 单目标非确定型不确定型决策方法 多目标确定型等价代换、目标规划、综合评价 多目标风险型期望值决策、期望效用决策 多目标非确定型不确定型决策方法,例8-1 (单目标确定型),为了生产某种产品,有三种建厂方案: 甲:实现自动化生产,固定成本800万元,产品每件可变成本为10万元。 乙:采用国产设备实现半自动化生产,固定成本为500万元,每件可变成本为12万。 丙:手工生产,固定成本为300万元,每件可变成本为15万元。 试确定不同生产规模的最优方案 (单目标确定型),可根据总成本结构分析图分析不

3、同范围的生产规模下总成本最低的方案。,单目标确定型决策问题,Q1=200/3,Q2=100,Q3=150,例8-2 :,有一项工程要决定下周是否开工。如果开工后天气好,则可按期完工,获得利润50000元,但若开工后天降暴雨而发生山洪,则将造成10000元的损失;假如不开工,则无论天气好坏都要支付窝工费1000元。根据资料预测,下周该地区天气好的概率是0.2,天降暴雨的概率是0.8。决策者应如何选择?,单目标风险型决策问题,例8-2 :,开工:50000*0.2 - 10000*0.8 = 2000(元) 不开工:-1000元 决策:开工。 若无法估计下周天气情况,属于何种类型的决策问题?,单目

4、标非确定性决策问题,例8-3 :,某厂欲生产一种携带式机械产品,要求该产品自重轻,成本低,功率大,寿命长,投资少等5个目标,为此设计了A,B,C三个方案。通过估算,各方案的目标值如下表所示,试对上述A,B,C三个方案的取舍作出决策。,多目标确定型,例8-4:,假定一公司正在评估四种可开发的产品,它只能选择其中的一种。公司决定用5项指标来考察每一种产品:到生产阶段前产品开发的总费用;公司得到的每单位产品的毛利;产品每年的潜在销售量;营销上与现有其它产品的配套程度;与公司现有产品在生产技术上的相似程度。,多目标风险型,每一项标准的最低要求: 开发费用不超过250万(公司所能筹到的最大款项) 单位产

5、品可能的毛利至少2000元(公司一直坚持经营高盈利产品的政策) 每年的销售潜力至少100单位(生产经理坚持) 营销策略的适应程度至少是一般水平(营销部经理坚持) 与其它产品的生产技术相近程度至少保持“一般”水平(制造部门经理坚持),多目标风险型决策,二、随机性决策 随机性决策亦称为风险型决策,是指在未来不确定的因素和信息不完全的条件下进行的决策,在高层决策中大量存在。决策者对客观情况不甚了解,但对将发生各事件的概率是已知的。决策者往往通过调查,根据过去的经验或主观估计等途径获得这些概率。,构成一个随机性决策问题的条件:,1存在着决策人希望达到的目标(利益最大或损失最小)。 2存在两个以上的行动

6、方案。 3存在两个以上的自然状态。 4可以计算不同行动方案在不同自然状态下的相应益损值。 5已知各种自然状态出现的概率。,决策表,损益值 自然状态(概率) 期望值 方案 1(P1) 2(P2) j(Pj) n(Pn) E(Ai) A1 a11 a12 a1j a1n A2 a21 a22 a2j a2n Ai ai1 ai2 aij ai n Am am1 am2 amj am n 决策 收益最大 maxAiE(Ai) Ai 或损失最小 minAiE(Ai),例8-5: 某厂要确定下一期内产品的生产批量,根据以前的经验并通过市场调查和预测,已知产品销路为好、一般、差三种情况的可能性分别为0.3

7、、0.5和0.2。产品采用大、中、小批量生产可能获得的效益也可以相应地计算出来,详见产品决策表8-1。现在面临企业的决策问题是采用什么批量生产。这就是一个随机性决策问题。,三、随机性决策问题的基本特点,1、后果的不确定性: 后果的不确定性是由自然状态的不确定性引起的。决策人要承担一定的风险,即自然状态的不确定性,使随机决策问题的基本特点之一是它的风险性。 2、后果的效用 后果的效用,是指各种决策的后果对决策人实际所产生的效果。同一后果对不同的决策人有不同的效用,或者说不同的决策人对冒风险有不同的态度。另外,即使在没有风险的情况下,不同的决策人对各种后果也有不同的偏好。 在随机性决策问题中,除效

8、果的客观性一面外,还有效果的主观性一面。,第二节 随机性决策问题的基本分析方法,解决随机性决策问题常用的决策原则有: 最大可能原则、渴望水平原则和期望值最大原则。,回本章目录,一、最大可能原则,根据概率论的知识,一个事件其概率愈大,发生的可能性也大。如果按最大概率的自然状态进行决策,就把随机性决策问题变成为确定型决策问题。 这种原则适用于在一组自然状态中某一状态出现的概率比其他状态出现的概率大很多,而各个状态下各行动方案的益损值差别不很大的情况。,二、渴望水平原则,所谓渴望水平是收益或损失的一个可以接受的标准。预先给出收益的一个渴望水平A,对每一个行动,都求出其收益达到渴望水平A的概率。使这个

9、概率最大的行动,就是渴望水平原则下的最优行动。,例8-6,一个卖冰棒的,以每支0.35元购进,零售每支0.50元,如当天卖不出去,就要溶化报废,根据以往经验每天售0、100、200、300、400、500支的可能性是0.01、0.05、0.10、0.30、0.30、0.24。其收益矩阵见表8-2。假定冰棒销售者的渴望水平是每天盈利30元,那么最优行动是什么。,表8-2 决策表 (单位:元),损益值 自然状态(概率) 期望值 方案 1(0.01) 2(0.05) 3(0.1) 4(0.3) 5(0.3) 6(0.24) E(Ai) A1 0 0 0 0 0 0 A2 -35 15 15 15 1

10、5 15 A3 -70 -20 30 30 30 30 A4 -105 -55 -5 45 45 45 A5 -140 -90 -40 10 60 60 A6 -175 -125 -75 -25 25 75 决策 收益最大 maxAiE(Ai) Ai 或损失最小 minAiE(Ai),由表可知:P(B(,a1) 30=0, P(B(,a2) 30=0 P(B(,a3) 30=P(3)+ P(4)+P(5)+P(6) =0.1+0.3+0.3+0.24=0.94 P(B(,a4) 30=P(4)+ P(5)+P(6)=0.84 P(B(,a5) 30=P(5)+ P(6)=0.54 P(B(,a

11、6) 30=P(6)=0.24,故第3个行动最好。即每天购进200支。 适用情况:在收益多少没有必要细致地区分,只要分为多或少两大类就可以的情况下,可以采用此法。例如产品合格不合格的决策问题等。,三、期望值最大原则,用期望值法进行决策是把每个行动方案的期望值求出来加以比较,然后选择期望值最大(当目标是利润时)或期望值最小(当目标是损失时)的行动方案。 先计算各策略的期望收益值,然后从这些期望收益值中选取最大者,它对应的策略为决策应选策略。即,例8-7,设某工厂是按批生产某产品并按批销售,每件产品的成本为30元,批发价格为每件35元。若每月生产的产品当月销售不完,则每件损失1元。工厂每投产一批是

12、10件,最大月生产能力是40件,决策者可选择的生产方案为0、10、20、30、40五种。试问这时决策者应如何决策?,表8-2,这时 max (0,44,76,84,80)=84S4 即选择策略S4=30,第三节 不确定型决策方法,所谓不确定型决策是指决策者对环境情况一无所知。这时决策者是根据自己的主观倾向进行决策,由决策者的主观态度不同可分为悲观决策准则、乐观决策准则、乐观系数决策准则、后悔值决策准则、等概率决策准则。,回本章目录,不确定型决策和随机性决策的区别在于:不确定型决策不具备随机性决策问题的第5个条件(已知各种自然状态出现的概率)。不确定型决策中,由于决策者对环境情况一无所知,也无法

13、通过调查获得有关信息,因此无法对各自然状态出现的概率作出主观判断。,一、悲观决策准则,悲观决策准则亦称华尔德决策准则(Wald Decision Criterion),是保守型决策准则。决策者对客观情况总是抱悲观态度,总是把事情结果估计得很不利。因此采取最安全、保守方法,从各方案中选取最坏的结果,然后再从最坏的结果中选取一个最好的作为行动方案。所以该准则又称“最大最小”决策准则。,表8-1 收益矩阵决策表,收益值 自然状态 方案 1 2 i n minj(aij) A1 a11 a12 a1j a1n A2 a21 a22 a2j a2n Ai ai1 ai2 aij ai n Am am1

14、am2 amj am n 决策 maxAiminj(aij) Ai,例8-8,某厂为了扩大生产能力,提出三种方案:对原厂进行扩建;对原厂进行技术改造;建新厂。预计每年的利润和市场销路情况如表8-4。试根据悲观决策准则选择最优方案。,表8-4 收益矩阵决策表 单位:万元,收益值 自然状态(市场销路) 方案 1(好) 2(一般) n(差) minj(aij) A1(扩建) 15 13 -4 -4 A2(技改) 8 7 4 4 A3(新建) 17 12 -6 -6 决策 maxAiminj(aij)=4 A2,分析,从表8-4可见,根据悲观决策准则,最优方案为对原厂进行技术改造,这样即使市场销路不畅

15、时,每年也可以获得4万元利润。,损失矩阵决策,如果损益值是以损失形式给出的损失矩阵,则根据悲观决策准则,应从各个行动方案的最大损失中选取损失最小的方案作为最优行动方案。其损失矩阵决策表见表8-5。,表8-5 损失矩阵决策表,收益值 自然状态 方案 1 2 i n maxj(aij) A1 a11 a12 a1j a1n A2 a21 a22 a2j a2n Ai ai1 ai2 aij ai n Am am1 am2 amj am n 决策 minAimaxj(aij) Ai,二、乐观决策准则,乐观决策准则是冒险型决策准则。决策者对客观情况抱乐观态度,一切从最好情况出发,决策带有一定的冒险性。

16、对于以收益最大为目标的决策,该准则采取从各方案中选取收益最大的,然后再从各最大收益中选取一个收益最大的方案作为行动方案。该准则又称“最大最大”决策准则。,表8-7 收益矩阵决策表 单位:万元,收益值 自然状态(市场销路) 方案 1(好) 2(一般) n(差) maxj(aij) A1(扩建) 15 13 -4 15 A2(技改) 8 7 4 8 A3(新建) 17 12 -6 17 决策 maxAimaxj(aij)=17 A3,三、乐观系数决策准则,乐观系数决策准则,又称乐观悲观决策准则。它是赫威斯(LHurweicz)于1951年提出的决策方法,所以该准则亦称赫威斯决策准则。该准则的特点是

17、对客观条件的估计即不那么乐观,但也不悲观,是介于悲观决策与乐观决策之间的一种折衷决策。,乐观系数,其折衷程度是通过一个系数反映的。称为乐观系数,其值域为01。越趋近于1,表示决策者对状态的估计越乐观,当=1时,该准则视同乐观决策准则;越趋近于0,表示决策者对状态的估计越悲观,当=0时,该准则视同悲观决策准则。,以收益最大为目标的决策过程如下:,1.选取各方案在各种自然状态下的最大收益值maxj(aij)和最小收益值minj(aij); 2.确定乐观系数值; 3.根据公式Zi= maxj(aij) +(1)minj(aij),计算各个方案的收益值; 4.从各方案的收益值中选取最大值maxAi(Z

18、i); 5.该最大值对应的方案即为最优方案。,例,对于例8-8,选定=0.7,利用乐观系数决策准则进行决策的过程如见表8-8:,表8-8 收益决策表 单位:万元,方案 maxj(aij) minj(aij) Zi (=0.7) A1(扩建) 15 -4 0.715+0.3(-4)=9.3 A2(技改) 8 4 0.78+0.34=6.8 A3(新建) 17 -6 0.717+0.3(-6)= 10.1 决策 maxAi(Zi)=10.1 A3 根据乐观系数决策准则,当=0.7时,建立新厂的方案A3最优。,四、 后悔值决策准则,后悔值决策准则又称萨维奇(Savage)准则。后悔值是自然状态下最大

19、值与该状态其它收益值之差。它反映了该状态下各方案与最佳方案的一种机会损失。该值越大,机会损失越大,越令人感到“后悔”。 后悔值决策准则是:从各方案的最大后悔值中,选取后悔值最小的方案作为最优的行动方案。,利用该准则进行决策过程如下:,1.根据收益矩阵,选取各自然状态下的最大收益值maxAi(aij); 2.计算各后悔值bij=maxAi(aij)aij; 3.选取各方案在各种自然状态下的最大后悔值maxj(bij); 4.从各方案的最大后悔值中选取最小的后悔值MinAimaxj(bij); 5.该最小后悔值对应的方案即为最优方案。,例,仍以例8-8为例,根据后悔值决策准则进行决策。 根据表8-

20、2的收益矩阵,选取各自然状态下的最大收益值分别为: 1状态:maxAi(ai1)=a31=17; 2状态:maxAi(ai2)=a12=13; 3状态:maxAi(ai3)=a23=4。,表8-4 收益矩阵决策表 单位:万元,收益值 自然状态(市场销路) 方案 1(好) 2(一般) n(差) A1(扩建) 15 13 -4 A2(技改) 8 7 4 A3(新建) 17 12 -6,表8-9 后悔值矩阵决策表 单位:万元,后悔值 自然状态(市场销路) 方案 1(好) 2(一般) 3(差) maxj(aij) A1(扩建) 2 0 8 8 A2(技改) 9 6 0 9 A3(新建) 0 1 10

21、10 决策 minAimaxj(aij)=8 A1,五、等概率决策准则,等概率决策准则亦称拉普拉斯(Laplace)准则。决策者在决策过程中,对各种自然状态出现的客观概率不能确定时,假定每一种状态出现的机会均等,“一视同仁”的给以相同的概率。 等概率决策准则,就是在各自然状态为等概率的条件下,以具有最大期望值的方案为最优方案。,表8-10 收益矩阵决策表 单位:万元,自然状态 等概率收益期望值 方案 1 2 3 Ej(aij) A1 15 13 -4 1/3 15+1/3 13+1/3 (-4)=8 A2 8 7 4 1/3 8+1/3 7+1/3 4= 6.34 A3 17 12 -6 1/

22、3 17+1/3 12+1/3 (-6)=7.7 决策 maxAiEj(aij)=8 A1,练习题,考虑下面的利润矩阵: 分别用以下四种决策准则求最优策略:(1)等可能性准则(2)最大最小准则(3)折衷准则(取=05)(4)后悔值准则。,最优策略为:(1)等可能性准则采取方案S4(2)最大最小准则采取方案S2(3)折衷准则采取方案S4(4)后悔值准则采取方案S1。,第四节 先验信息和主观概率,利用期望值法进行随机问题决策的准确度,主要取决于先验信息的准确程度。本节将讨论先验信息的性质,以及确定主观概率的常用方法(P174)。,回本章目录,一、主观概率(subjective probabilit

23、y),1. 为什么引入主观概率 有的自然状态无法重复试验。 如:明天是否下雨 新产品销路如何 明年国民经济增长率如何 能否考上研究生 试验费用过于昂贵、代价过大。 例:洲际导弹命中率 战争中对敌方下一步行动的估计,2.主观概率定义:合理的信念的测度 某人对特定事件会发生的可能的度量。即他相信(认为)事件将会发生的可能性大小的程度。这种相信的程度是一种信念,是主观的,但又是根据经验、各方面的知识,对客观情况的了解进行分析、推理、综合判断而设定(Assignment)的,与主观臆测不同。,主观概率(subjective probability) 和客观概率(objective probabilit

24、y),(一) 基本属性: O:系统的固有的客观性质,可在相同条件下重复试验得到(频次)。 S:概率是观察者而非系统的性质,是观察者对系统处于某状态的信任程度 (二)抛硬币:正面向上概率为 O:只要硬币均匀,抛法类似,次数足够多,正面向上的概率就是,这是简单的定义。 S:认为硬币是均匀的,正、反面出现的可能性(似然率)相同,是个主观的量。,(三)下次抛硬币出现正面的概率是 O:这种说法不对,不重复试验就谈不上概率 S:下次出现正、反是等可能的。但是他不是说硬币本身是公正的,它可能会有偏差,就他现有知识而言,没有理由预言一面出现的可能会大于另一面,但多次抛掷的观察结果可以改变他的信念。 O、S:下

25、次抛硬币出现正面还是反面不能确定,但知道: 要么是正面,要么是反面。,第五节 修正概率的方法贝叶斯公式的应用,一、决策树的构成和决策步骤 决策树法是风险型决策中常用的方法。 优点:能使决策问题形象直观,思路清晰,便于思考与集体讨论。特别适用于多级决策。 决策树又叫决策图。它是以方框和圆圈为结点,由直线连接而成的一种树枝形状的结构。,回本章目录,由状态结点引出若干条直线,每条直线代表一个自然状态及其可能出现的概率,故称为概率枝。 在概率枝末端画个三角,叫结果点。 在结果点旁边列出不同状态下的收益值或损失值,以供决策之用。,在图形中,方框结点叫决策点。 由决策点引出若干条直线,每条直线代表一个方案

26、,叫方案枝。 在各个方案枝的末端画上一个圆圈,叫做状态结点。,应用决策树的决策过程,逆着决策树的顺序,由右向左逐步进行, 由右端的损益值(或效用值)和概率枝的概率,计算出该方案的期望损益值(或期望效用值), 然后,根据不同方案的期望损益值作出选择,将未选中的方案在图上剪去,直至最后决策点, 只剩下一条树枝,即为决策的最优方案。,例1,为了开发某种新产品,需添加专用设备,有外购和自制两种方案可供选择,根据有关市场调查,建立如下收益矩阵决策表:,表1 收益矩阵决策表 单位:万元,收益值 自然状态(市场销路) 1(好) 2(不好) E(Ai) 方案 P1=0.65 P2=0.35 A1(外购) 30

27、0 -100 160 A2(自制) 120 -30 67.5 决策 maxAiE(Ai)=160 A1,对于该题可以画出决策树:,160 1(0.65) 300 2 160 A1 2(0.35) -100 1 A 2 67.5 3(0.65) 120 3 4(0.35) -30 图9-1,计算各状态点的期望值:,点:3000.65+(-100)0.35=160(万元) 点:1200.65+(-300)0.35=67.5(万元) 比较各状态点的期望值,选取期望值大的点。点与决策点 1 之间的方案枝所代表的方案,即为所选的最优方案。点的期望值即为决策的效益期望值。 对其余的方案枝剪掉弃之。,二、

28、修正概率的方法贝叶斯公式的应用,前面曾提到决策者常常碰到的问题是没有掌握充分的信息,于是决策者通过调查及做试验等途径来获得更多的更确切的信息,以便掌握各事件发生的概率,这可以利用贝叶斯公式来实现,它最大限度地利用现有信息,并加以连续观察和重新估计各事件发生的概率。,贝叶斯法(后验概率法)(Bayes法),处理风险决策问题时,需要知道各种状态出现的概率:P(S1), P(S2), , P(Sn),这些概率称为先验概率。,风险是由于信息不充分造成的,决策过程还可以不断收集信息,如果收集到进一步信息I,对原有各种状态出现概率估计可能会有变化,变化后的概率为P(SiIk),此条件概率表示在追加信息I后

29、对原概率的一个修正,所以称为后验概率。Bayes法就是一种后验概率方法。,P(Si Ik)通过概率论中Bayes公式计算得出,贝叶斯决策是利用贝叶斯公式进行概率修正,而后利用后验概率进行决策的方法。下面结合例题讲解贝叶斯决策。,兴华开发公司已购得一块地用于建造一个高档的综合商业楼,其位置在广州的繁华地段。每一个建筑物单元的价格是38138万,取决于单元所处楼层、面积以及备选的设施。,公司对这套楼房的设计,已制定三个方案: 小型楼,有6层,30个单元; 中型楼,有12层,60个单元; 大型楼,有18层,90个单元。 决策问题是要从这三个方案中选择其中之一,并提出决策分析的书面报告,包括分析计算书

30、,建议以及风险提示。,为了进行决策分析,必须做好以下两项工作: (1)市场调研,综合楼被市场接受的程度如何?亦即市场的需求如何? 对此问题,公司管理者通过调研认为,只有两种市场接受状态,称为决策者无法控制的自然状态: 高的市场接受程度,对楼房有显著需求; 低的市场接受程度,对楼房需求有限。,(2)要根据工程设计与造价核算以及销售价格计算出不同方案,不同自然状态时,楼房的盈亏(损益)表。对该问题,经计算得到如表所示的损益表。 决策问题的损益表,一般讲,补充信息是可以通过对自然状态样本信息设计的实验方法来取得,包括原始资料的采样、产品检验、市场调研,等等。比如,通过天气预报的验证信息,来修正天气状

31、态的先验概率;通过产品检验的正确与否的信息,来修正产品的正、废品先验概率。对兴华公司来讲,可以通过市场调研,调查有多少比率的人有兴趣买楼,记为 ,有多少比率的人没有兴趣买楼,记为 ,则可以获得四个条件概率,记为: , , , 。 它们也叫做似然函数。,似然函数的意义是:在真正高接受程度的状态下核查为有兴趣(即支持建楼)买楼的概率为0.9,而不支持的为0.1;在真正低接受程度的状态下,核查为不支持的概率为0.75,反而支持的为0.25。这些补充信息是在明确了高、低接受程度的条件下,进一步调查核实的信息,由此统计出的条件概率。,有了先验概率和似然函数,可以运用贝叶斯全概率公式,计算出后验概率P(S

32、 | I):,按以上数据,可算得其后验概率见下表,表(1)有兴趣买楼者I1的有关概率计算表,表(2)没有兴趣买楼者I2的有关概率计算表,根据上列概率计算表,可以画出如下决策树,结论:该问题是两阶段决策,第一阶段的决策是进行市场调研;第二阶段的决策是当市场报告是支持建楼I1时(P(I1)50%),应建大型楼;当市场报告是不支持I2时,应建中型楼。,考虑到原始的先验概率,若0.8的概率表示是自然状态S1的完美信息(全情报)(Perfect information),在这种情形下,当然应选择建大楼方案d3,即可望收益20;若0.2的概率表示是自然状态S2的完美信息,则选择建小楼方案d1;因此,这一决

33、策策略的期望值为: 我们可以认为该期望值17.4,就是有完美信息时的期望值。,而前述先验概率下的抉择方案d3的 则认为是无完美信息时的期望值。 所以完美信息价值(全情报价值)EVPI (The expected Value of the perfect information, )就是上述两者的差,即 ,对本问题,抽样情报价值EVSI (Expected Value of sample information, EVSI)则可按下式计算: 此期望值之差就是由于有了样本信息而增加的期望值。 综上所述,样本信息的效率(Efficiency of sample information, E)则为,对

34、兴华公司的决策问题,按以上计算可得: 样本信息的效率E愈大,表示样本信息愈益像完美信息那样完好,决策者不必再补充什么信息源;E愈小,决策者则应该再进一步搜集其他的信息。,完美信息价值EVPI(expected value with perfect information, )。 补充情报价值EVAI (expected value of additional information) 抽样情报价值EVSI:当补充情报是采取抽样方法获得时,这时补充情报价值习惯上称为抽样情报价值EVSI (expected value with sample information),课堂练习:,某钻探大队在某地

35、区进行石油勘探,主观估计该地区有油的概率为P(O)=0.5;无油的概率为P(D)=0.5。为了提高钻探的效果,先做地震试验。根据积累的资料得知:凡有油地区做试验结果亦好的概率为P(FO)=0.9;做试验结果不好的概率为P(UO)=0.1。凡无油地区做试验结果好的概率为P(FD)=0.2;做试验结果不好的概率为P(UD)=0.8。问在该地区做试验后,有油与无油的概率各是多少?,解 : 先计算做地震试验好与不好的概率。,做地震试验好的概率 P(F)=P(O)P(FO)+P(D)P(FD) =0.50.9+0.50.2 =0.55 做地震试验不好的概率 P(U)=P(O)P(UO)+P(D)P(UD

36、) =0.50.1+0.50.8=0.45 利用贝叶斯公式计算各事件的事后(后验)概率。,用贝叶斯公式计算各事件的事后(后验)概率,做地震试验好的条件下有油的概率,做地震试验好的条件下无油的概率,做地震试验不好的条件下有油的概率,做地震试验不好的条件下无油的概率,第六节 效用理论在随机决策中的应用,一、效用及效用曲线 效用值:货币的主观价值“效用值”衡量人们对货币的主观认识。效用这概念首先是由贝努利 (D.Berneulli)提出的, 他认为人们对其钱财的真实 价值的考虑与他的钱财拥有量 之间有存在着对数关系。 如左图所示,,回本章目录,效用是主观的。,同一事物对不同的人效用不同,5角钱的硬币

37、丢在地上,一个穷人会把它捡起来,一个富人则会视而不见。,效用是多属性的。,收益只是影响因素之一,决策者的价值观念、行为偏好等决定了决策方案效用值的大小。例如,一位知识分子面临两种选择:A.著书,一年挣得稿费5000元;B.擦鞋,一年收入20000元。一般来讲他会选择前者,尽管收益相差悬殊。,效用是决策环境的产物。,同一个决策者在不同的环境条件下,对同一个方案会有不同的价值感。如某人创业初期有5000元,有两个投资方案:A.买一辆板车,每月收入2000元;B.买彩票,1%的概率中百万元大彩,99%的概率血本无归。这时他一般会选择A,但当他发达以后,若两者择一,则可能会选择后者。这里选择的依据就是

38、效用值。,效用值计算及效用曲线,效用值,效用值是一个相对的指标值,一般可规定:凡对决策者最爱好、最倾向、最愿意的事物(事件)的效用值赋予1;而最不爱好的,赋予0,效用是无量纲指标。通过效用这个指标可将某些难于量化的有质的差别的事物给予量化。如某人在选择工作时,要考虑工作地点、工作性质、单位福利等因素,可将这些因素折合为效用值,得到各方案的综合效用值,然后选择效用值最大的方案,这就是最大效用值决策准则。,在风险情况下,对于只作一次决策的问题,如果用最大期望值决策准则,就不太合理了,如表8-16是各方案及按最大收益期望值的计算结果。 表8-16的三个方案的EMV都相同,显然这三个方案并不是等价的。

39、另一方面因EMV*给出的是平均意义下的最大,当决策后只实现一次时,用EMV*决策准则就不恰当了。 这时可用最大效用值决策准则来解决这矛盾。,表8-12,二、效用曲线的确定,确定效用曲线的基本方法有两种: 一种是直接提问法; 另一种是对比提问法。一般采用改进的V-M(Von Neumann Morgenstern)法。,归纳,不同形状的效用曲线,代表了不同决策者对待风险的不同态度。 一般可分为:保守型、中间型、冒险型三种。其对应的曲线见图8-4。,图8-4 保守型、中间型、冒险型三种,保守型、中间型、冒险型三种的特征,具有中间型效用曲线的决策者,他认为他的收入金额的增长与效用值的增长成等比关系;

40、 具有保守型效用曲线的决策者,他认为他对损失金额愈多愈敏感,相反地对收入的增加比较迟钝,即他不愿承受损失的风险; 具有冒险型效用曲线的决策者,他认为他对损失金额比较迟钝,相反地对收入的增加比较敏感,即他可以承受损失的风险。,收益值 自然状态(市场销路) 1(好) 2(不好) 方案 P1=0.65 P2=0.35 A1(外购) 300 -100 A2(自制) 120 -30,课堂练习1:为了开发某种新产品,需添加专用设备,有外购和自制两种方案,根据有关市场调查,建立如下收益矩阵决策表,分别用期望值和期望效用准则进行决策。(u(300)=1,u(-100)=0,假设决策者对待风险的态度为中间型)。

41、,期望值决策:,160 1(0.65) 300 2 160 A1 2(0.35) -100 1 A 2 67.5 3(0.65) 120 3 4(0.35) -30,期望效用决策:,0.65 1(0.65) 1 2 0.65 A1 2(0.35) 0 1 A 2 0.42 3(0.65) 0.55 3 4(0.35) 0.175,课后练习2: 某厂为适应市场的需要,准备扩大生产能力,有两种方案可供选择:第一方案是建大厂;第二方案是先建小厂,后考虑扩建。如建大厂,需投资700万元,在市场销路好时,每年收益210万元,销路差时,每年亏损40万元。在第二方案中,先建小厂,如销路好,3年后进行扩建。建

42、小厂的投资为300万元,在市场销路好时,每年收益90万元,销路差时,每年收益60万元,如果3年后扩建,扩建投资为400万元,收益情况同第一方案一致。未来市场销路好的概率为0.7,销路差的概率为0.3;如果前3年销路好,则后7年销路好的概率为0.9,销路差的概率为0.1。如果前三年销路差,则后七年仍然是销路差。无论选用何种方案,使用期均为10年,试做决策分析。,第一步,画出决策树图。,1,4,5,7,8,9,6,2,3,60,60,90,-40,210,-40,210,-40,建大厂,建小厂,销路好0.7,销路差0.3,销路好0.7,销路差0.3,销路好0.9,销路差0.1,扩建,不扩建,销路好

43、0.9,销路差0.1,销路好0.9,销路差0.1,3年内,7年内,-700,-300,-400,1295,609,695.5,527.5,-280,695.5,420,895,895,第二步,从右向左计算各点的期望收益值。,点4:2100.97-400.17=1295(万元) 点5:-407=-280(万元) 点2:12950.7 + 2100.73 - 2800.3 - 400.33 - 700 =527.5(万元) 点8:2100.97 - 400.17-400 = 895(万元) 点9:900.97 + 600.17 = 609(万元) 点6是个决策点,比较点8和点9的期望收益,选择扩建。 点6:895(万元) 点7:607=420(万元) 点3:8950.7 + 900.73 + 4200.3 + 600.33 - 300 =695.5(万元),回总目录,回本章目录,第三步,进行决策。,比较点2和点3的期望收益,点3期望收益

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 其他


经营许可证编号:宁ICP备18001539号-1