重复博弈的例子.doc

上传人:scccc 文档编号:12075896 上传时间:2021-12-01 格式:DOC 页数:7 大小:28.50KB
返回 下载 相关 举报
重复博弈的例子.doc_第1页
第1页 / 共7页
重复博弈的例子.doc_第2页
第2页 / 共7页
重复博弈的例子.doc_第3页
第3页 / 共7页
亲,该文档总共7页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

《重复博弈的例子.doc》由会员分享,可在线阅读,更多相关《重复博弈的例子.doc(7页珍藏版)》请在三一文库上搜索。

1、重复博弈的例子重复博弈的例子【篇一:重复博弈的例子】1有限次重复博弈和无限次重复博弈有什么区别?这些区别对我们有什么启发?2两次重复下面的得益矩阵表示的静态博弈。如果你是博弈方1,你会采用怎样的策略。3两次重复下面这个得益矩阵表示的两人静态博弈。问能否有一个子 博弈完美纳什均衡策略组合,实现第一阶段的得益是(4,4)?如能,给出双方的策略,如不能,证明为什么不能。如果策略组合(下,左)的得益改为(1,5)会发生什么变化,至少能在部分阶段实现得益(4,4)的条件是什么?4求出下列得益矩阵表示的静态博弈的纳什均衡,并说明有限次和无 限次重复该博弈时两博弈方的均衡策略。【篇二:重复博弈的例子】什么是

2、重复博弈顾名思义,重复博弈是指同样结构的博弈重复许多 次,其中的每次博弈称为 阶段博弈”(stage games )。重复博弈是 中的重要内容,它可以是的重复博弈,也可以是。在重复博弈中,每次博弈的条件、规则和内容都是相同的,但由于有一个长期利益的存在,因此各博弈方在当前阶段的博弈中要考虑到不 能引起其它博弈方在后面阶段的对抗、报复或 ,即不能象在一次性中 那样毫不顾及其它博弈方的利益。有时,一方做出一种合作的姿态,可能使其它博弈方在今后阶段采取合作的态度,从而实现共同的长期 利益。F面给出两个重要定义: 定义1:可信性是指动态博弈中先行动的博弈方是否该相信后行动的 博弈方会采取对自己有利或不

3、利的行为。定义2 :如果动态博弈中各博弈方的策略在动态博弈本身和所有中都 构成均衡,则称该策略组合具有子博弈完美性。在重复博弈中,可信性同样是非常重要的,也即子博弈完美性仍是判 断均衡是否稳定可靠的重要依据,又由于长期利益对短期行为的制约 作用,因此有一些在一次性博弈中不可行的威胁或诺言在重复博弈中 会变为可信的,从而使博弈的均衡结果出现更多的可能性。重复博弈的特征1、阶段博弈之间没有物质上的联系,也就是说,前一阶段 的博弈不改变后一阶段的结构。2、所有参与人观察到博弈过去的历史。3、参与人的总得益是所有阶段博弈得益的贴现值之和。a、b两个参与人都有两种定价待选择:定高价或定低价。如果两个参与

4、人都定低价,则每个参与人的收益均为20个单位;如果两人都定高价,则每人的收益均为 30个单位;如果其中某一参与人定低价, 而另一参与人定高价,则定低价的参与人有占有更多的获得40个单位的收益,定高价的参与人由于失去一部分市场份额而只获得10个单位的收益。显然,在这个一次性完全信息静态博弈中,两个参与人 均有,占优策略均衡为 a、 b双方都定低价。如果a、 b之间的定价博弈是多次进行的,那么,问题就不是如此简 单了。我们先来分析博弈重复次数为无限时的情况。如果a、b双方都选择合作,都保持定高价,则双方在每个阶段的收 益均为30个单位,记为(30, 30, 30,);如果a、b中有一方(女口 a)

5、采取投机行为,在实际定价中选择不与对方合作,在第一阶段就通 过选择定价策略使得选择高价策略的对手b受损,则受损的一方b 一定会在第二阶段及其以后的定价中也选择低价策略,加以报复,这样 一来,首先选择不合作的一方 a在个阶段的收益为(40 , 20 , 20 ,), 显然,其远远小于合作、维持高价情况下的总收益。因为,首选选择 不合作的一方a,只是在第一阶段获得了 额外”收益,但在以后个阶 段的收益将因为对手 b的报复性选择而减少,并且,重复若干此后, 首先选择不合作的一方a将得不偿失。在这里,b选择的策略称为“”。冷酷策略是指重复博弈中的任何参 与人的一次性不合作将引起其他参与人的永远不合作,

6、从而导致所有 参与人的收益减少。因此,所有参与人具有维持合作的积极性。我们 再来讨论博弈重复次数为有限时的情况。重复次数有限博弈与重复次数无限博弈之间的惟一区别,是所有参与 人都可以明确无误地了解重复的次数,即可以准确地到最后一个阶段 博弈。而在最后阶段的博弈中,任何一个参与人选择不合作,不会导 致其他参与人的报复。因此,所有参与人都会在最后阶段的博弈中选 择自己的占优策略,那就是不合作。上例中,在最后阶段博弈中选择 低价是所有参与人的占优策略。既然所有参与人都会在最后阶段选择不合作,那么,在倒数第二阶段 博弈中任何参与人也就没有必要担心由于自己选择不合作,导致其他 参与人在最后阶段博弈中的报

7、复。因此所有参与人在倒数第二阶段博 弈中,也都会选择不合作。即在倒数第二阶段博弈中,所有参与人都 会选择占优策略。由此类推,可以得岀以下结论:在阶段性博弈存在惟一的纳什均衡时,阶段博弈的纳什均衡解就是重复次数有限博弈的唯一解。 即重复次数有限博弈的每个阶段的均衡解都是一次性博弈的纳什均衡解。注意,上述推论成立的前提条件是阶段性博弈纳什均衡的惟一性。参考文献 f 池州学院.西方经济学m.第六章市场结构理论第八节博弈论初步【篇三:重复博弈的例子】再举一个生活中的例子:如果你去菜场买菜,当你对某种菜的质量、口味等有疑虑时,卖菜的阿姨常会讲:你放心,我一直在这儿卖呢!这句朴实的话中其实包含了华丽的博弈

8、论”思想:我卖与你们买是一个次数无限的重复博弈,我今天骗了你,你们今后就不会再来我这儿买了,所以我不会骗你的,菜的质量、口味肯定没问题。而你在听了 阿姨的上述一句话后,常常也会打消疑虑,买菜回家。在博弈中,人们掌握的信息经常是不完全的,这就需要在博弈进行过程(即动态博弈)中不断地收集信息、积累知识、修正判断。成语故事 黔 驴技穷”实际上就包含了一个不完全信息动态博弈。毛驴刚到贵州时, 老虎摸不准这个大动物究竟有多大本领,因而躲在树林里偷偷观察, 这在老虎当时拥有的信息条件下是一种最优策略选择。过了一阵子, 老虎走出树林,逐渐接近毛驴,就是想获得有关毛驴的进一步信息。一天,毛驴大叫一声,老虎吓了

9、一跳,急忙逃走,这也是最优策略选 择。又过了一些天,老虎又来观察,并对毛驴挨得很近,往毛驴身上 挤碰,故意挑衅它。毛驴在忍无可忍的情况下,就用蹄子踢老虎,除 此之外,别无它法。老虎最终了解到毛驴的真实本领后,就扑过去将 它吃了。在这个故事里,老虎通过观察毛驴的行为逐渐修正对毛驴的 看法,直到看清它的真面目。事实上,毛驴的策略也是正确的,它知 道自己的技能有限,总想掩藏自己的真实技能。 老虎吃掉毛驴的策略, 在 博弈论”中就是所谓的 精炼贝叶斯均衡”。人们常提到的 上有政策、下有对策”,其实是对管理者与被管理者之 间的动态博弈的一种描述, 面对上边的政策,下边寻求对策是正常的、 必然的。从 博弈

10、论”的角度讲,上边的政策制定必须在考虑到下边可 能会有的对策的基础上进行,否则,政策就不会是科学、合理的。从以上对 博弈论”简要、通俗的介绍中可以发现,我们身边充满了博 弈,或者说,我们身边的许多行为、现象都可用博弈来概括。博弈论”不仅属于经济学,也理应属于社会学、政治学、心理学、历史学 等,这些学科也有理由分享 博弈论”那旖旎的学术风光和精细的分析 技巧。V案例二:智猪博弈这个例子讲的是,猪圈里有两头猪,一大一小.猪圈的一头有一个猪食槽,另一头安装一个按钮,控制着猪食的 供应。按一下按钮会有10个单位的猪食进槽,但谁按按钮需要付2 个单位的成本.若大猪先到,大猪吃到9个单位,小猪只能吃1个单

11、位;若同时到,大猪吃7个单位,小猪吃3个单位;若小猪先到,大 猪吃6个单位,小猪吃4个单位。表中第一格表示两猪同时按按钮, 因而同时走到猪食槽,大猪吃7个,小猪吃3个,扣除2个单位的成 本,支付水平分别为5和1.其他情形可以类推.在这个例子中,什么是纳什均衡?首先我们注意到,无论大猪选择”按”还是”等待”小猪的最优选择均是”等待”.比如说给定大猪按,小猪也按时得到1 个单位,等待则得到4个单位;给定大猪等待,小猪按得到-1单位, 等待则得0单位,所以,”等待”是小猪的占优战略.给定小猪总是选 择”等待”大猪的最优选择只能是”按”所以,纳什均衡就是:大猪 按,小猪等待,各得4个单位多劳者不多得!

12、V案例三:性别战> 这个例子讲的是一男一女谈恋爱,有些业余活动要安排,或者去 看足球比赛,或者去看芭蕾舞演出.男的偏好足球,女的则更喜欢芭 蕾,但他们都宁愿在一起, 不愿分开。这个博弈中,有两个纳什均衡: (足球,足球)(芭蕾,芭蕾).就是说,给定一方去足球场,另一 方也会去足球场;类似的,给定一方去看芭蕾舞,另一方也会去看芭 蕾舞.那么,究竟哪一个纳什均衡会实际发生?我们不知道.只有看 实际生活了.V案例四:斗鸡博弈设想两个人举着火棍从独木桥的两端走向中央进行火拼,每个人都有两种战略:继续前进,或退 下阵来.若两人都继续前进,则两败俱伤;若一方前进另一方退下来, 前进者取得胜利,退下来

13、的丢了面子;若两人都退下来,两人都丢面 子.这个博弈里也有两个均衡:如果一方进,另一方的最优战略就是 退。两人都进或退都不是纳什均衡。V案例五:市场进入阻挠 这是产业组织经济学中的一个例子. 设 想有一个垄断企业已在市场上(称为”在位者”),另一个企业虎视眈 眈想进入(”进入者”).在位者想保持自己的垄断地位,所以就要阻 挠进入者进入.在这个博弈中,进入者有两种战略可以选择:进入还是不进入;在位者也有两种战略:默许或斗争.假定进入之前垄断 利润为3 0 0,进入之后寡头利润合为100(各得50),进入成 本为10 .各种战略组合下的支付矩阵亦可列表.这个博弈中也有两 个纳什均衡,即(进入,默许),(不进入,斗争).为什么(进入,默许)是纳什均衡?因为给定进入者进入,在位者选择默许时得5 0 单位利润,选择斗争时得不到利润, 所以,最优战略是默许。类似的, 给定在位者选择默许,进入者的最优战略就是进入.尽管在进入者选 择不进入时,默许和斗争对在位者是一个意思,只有当在位者选择斗 争时,不进入才是进入者的最优选择,所以,(不进入,斗争)是一 个纳什均衡,而(不进入,默许)不是一个纳什均衡。现实中我们知道存在很多不可置信的威胁,V案例六:承诺行动行动”这个概念。而如何令不可置信的威胁变的真正具有威胁能力呢?那就要引入 诺彳

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 社会民生


经营许可证编号:宁ICP备18001539号-1