其他类型的对策论简介.ppt

上传人:本田雅阁 文档编号:2583163 上传时间:2019-04-12 格式:PPT 页数:13 大小:260.01KB
返回 下载 相关 举报
其他类型的对策论简介.ppt_第1页
第1页 / 共13页
其他类型的对策论简介.ppt_第2页
第2页 / 共13页
其他类型的对策论简介.ppt_第3页
第3页 / 共13页
亲,该文档总共13页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

《其他类型的对策论简介.ppt》由会员分享,可在线阅读,更多相关《其他类型的对策论简介.ppt(13页珍藏版)》请在三一文库上搜索。

1、在对策论中可以根据不同方式对对策问题进行分类,通常分类的方式有: (1)根据局中人的个数,分为二人对策和多人对策; (2)根据各局中人的赢得函数的代数和是否为零,可分为零和对策和非零和对策; (3)根据局中人是否合作,又可分为合作对策和非合作对策; (4)根据局中人的策略集中个数,又分为有限对策和无限对策(或连续对策); (5)也可根据局中人掌握信息的情况及决策选择是否和时间有关可分为完全信息静态对策、完全信息动态对策、非完全信息静态对策及非完全信息动态对策;也可以根据对策模型的数字特征又分为矩阵对策、连续对策、微分对策、阵地对策、凸对策、随机对策。 本节只对对策论中非合作对策的完全信息对策、

2、多人非合作对策、非零和对策作一个简单的叙述性介绍。,4 其他类型的对策论简介,一、完全信息静态对策 该对策是指掌握了参与人的特征、战略空间、支付函数等知识和信息并且参与人同时选择行动方案或虽非同时但后行动者并不知道前行动者采取了什么行动方案。 纳什均衡是一个重要概念。在一个战略组合中,给定其他参与者战略的情况下,任何参与者都不愿意脱离这个组合,或者说打破这个僵局,这种均衡就称为纳什均衡。下面以著名的“囚徒困境”来进一步阐述,4 其他类型的对策论简介,例1 “囚徒困境”说的是两个囚犯的故事。这两个囚徒一起做坏事,结果被警察发现抓了起来,分别关在两个独立的不能互通信息的牢房里进行审讯。 在这种情形

3、下,两个囚犯都可以做出自己的选择:或者坦白(即与警察合作,从而背叛他的同伙),或者抵赖(也就是与他的同伙合作,而不是与警察合作)。这两个囚犯都知道,如果他俩都能抵赖的话,就都会被释放,因为只要他们拒不承认,警方无法给他们定罪。但警方也明白这一点,所以他们就给了这两个囚犯一点儿刺激:如果他们中的一个人坦白,即告发他的同伙,那么他就可以被无罪释放。而他的同伙就会被按照最重的罪来判决。当然,如果这两个囚犯都坦白,两个人都会被按照轻罪来判决。如图1-1所示。,图1-1 囚徒困境,由分析可知,上例中每个囚犯都会选择坦白,因此这个战略组合是固定的,(坦白,坦白)就是纳什均衡解。而这个均衡是不会被打破的,即

4、使他们在坐牢之前达成协议。 囚徒困境反映了个人理性和集体理性的矛盾。对于双方,(抵赖,抵赖)的结果是最好的,但因为每个囚徒都是理性人,他们追求自身效应的最大化,结果就变成了(坦白,坦白)。个人理性导致了集体不理性。,二、完全信息动态对策 在完全信息静态对策中,假设各方都同时选择行动。现在情况稍复杂一些。如果各方行动存在先后顺序,后行的一方会参考先行者的策略而采取行动,而先行者也会知道后行者会根据他的行动采取何种行动,因此先行者会考虑自己行动会对后行者的影响后选择行动。这类问题称为完全信息动态对策问题。 例2 某行业中只有一个垄断企业A,有一个潜在进入者企业B。B可以选择进入或不进入该行业这两种

5、行动,而A当B进入时,可以选择默认或者报复两种行动。如果B进入后A企业报复,将造成两败俱伤的结果,但如果A默认B进入,必然对A的收益造成损失。同样的,如果B进入而A报复,则B受损,反之,将受益。把此关系用图1-2表示。,由分析可知,上例中(B选择不进入,A选择报复)和(B选择进入,A选择默许)都是纳什均衡解。但在实际中,(B选择不进入,A选择报复)这种情况是不可能出现的。因为B知道他如果进入,A只能默许,所以只有(B选择进入,A选择默许)会发生。或者说,A选择报复行动是不可置信的威胁。对策论的术语中,称(A选择默许,B选择进入)为精炼纳什均衡。当只当参与人的战略在每一个子对策中都构成纳什均衡,

6、这个纳什均衡才称为精炼纳什均衡。 当然,如果A下定决心一定要报复B,即使自己暂时损失。这时威胁就变成了可置信的,B就会选择不进入,(B选择不进入,A选择报复)就成为精炼纳什均衡。 军事交战时,“破釜沉舟”讲的就是一种可置信威胁。实际企业经营中也有很多类似的例子。,三、多人非合作对策 有三个或三个以上对策方参加的对策就是“多人对策” 。多人对策同样也是对策方在意识到其他对策方的存在,意识到其他对策方对自己决策的反应和反作用存在的情况下寻求自身最大利益的决策活动。因而,它们的基本性质和特征与两人对策是相似的,我们常常可以用研究两人对策同样的思路和方法来研究它们,或将两人对策的结论推广到多人对策。,

7、不过,毕竟多人对策中出现了更多的追求各自利益的独立决策者,因此,策略的相互依存关系也就更为复杂,对任一对策方的决策引起的反应也就要比两人对策复杂得多。并且,在多人对策中还有一个与两人对策有本质区别的特点,即可能存在“破坏者”。所谓破坏者即一个对策中具有下列特征的对策方:其策略选择对自身的得益没有任何影响,但却会影响其它对策方的得益,有时这种影响甚至有决定性的作用。例如有三个城市争夺某届奥运会的主办权。,四、非零和对策 所谓零和对策,就是一方的收益必定是另一方的损失。这种对策的特点是不管各对策方如何决策,最后各对策方得益之和总是为零。有某些对策中,每种结果之下各对策方的得益之和不等于0,但总是等

8、于一个非零常数,就称之为“常和对策”。当然,可以将零和对策本身看作是常和对策的特例。 “零和对策”和“常和对策”之外的所有对策都可被称为“非零和对策”。非零和对策即意味着在不同策略组合(结果)下各对策方的得益之和一般是不相同的。如前述囚徒困境就是典型的非零和对策。,应该说,非零和对策是最一般的对策类型,而常和对策和零和对策都是它的特例。在非零和对策中,存在着总得益较大的策略组合和总得益较小的策略组合之间的区别,这也就意味着在对策方之间存在着互相配合,争取较大的总得益和个人得益的可能性。 两人零和对策是完全对抗性的,总得益为0,其解法可能性根据矩阵对策予以求解,但在非零和对策下,矩阵对策求解法已

9、经不适用了,下面用例子予以说明。,例3 甲乙两公司生产同一产品,均想以登广告扩大产品销售,每家公司都有“登”与“不登”两种策略,双方的得益矩阵如下。,我们根据得益矩阵来分析。从甲公司立场上看,登有利,不管乙公司如何,保证赢利至少是3,最多是9。如果不登,可能要蒙受损失2。从乙公司的立场上看,同样理由,还是登广告好。但是,这是从理智行为出发的策略,是以彼此不能合作为前提的。上述两公司均采取登广告的策略是稳定的结局。可是,如果彼此能够合作,而都不登广告,免去了广告费,反而各自的赢利要多。在彼此不能合作的情况下,如果甲不登,恰好乙登,甲只好出现败局,这是非理智的策略,带有危险性。因此,非零和对策常常不易获得最理想的答案。对于三个以上的多人零和对策,互相利害关系更加复杂。,习题:P368,习题1 习题3 习题4,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 其他


经营许可证编号:宁ICP备18001539号-1