03完全且完美信息动态博弈汇总.doc

上传人:scccc 文档编号:13008513 上传时间:2021-12-10 格式:DOC 页数:30 大小:420KB
返回 下载 相关 举报
03完全且完美信息动态博弈汇总.doc_第1页
第1页 / 共30页
03完全且完美信息动态博弈汇总.doc_第2页
第2页 / 共30页
亲,该文档总共30页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

《03完全且完美信息动态博弈汇总.doc》由会员分享,可在线阅读,更多相关《03完全且完美信息动态博弈汇总.doc(30页珍藏版)》请在三一文库上搜索。

1、经济博弈论 完全且完美信息动态博弈 本部分内容简介 讨论动态博弈,所有博弈方都对博弈过程和得益 完全了解的完全且完美信息动态博弈。 动态博弈与静态博弈的区别主要体现在博弈方的选择、 行为有先后次序等方面,故它们在表示方法、利益关系、 分析方法和均衡概念等有所不同。 2.2.介绍动态博弈分析的概念和方法,特别是子博弈 完美均衡和逆推归纳法,并介绍各种经典的动态博 弈模型。 本部分主要内容 3.1动态博弈的表示法和特点 3.2可信性和纳什均衡的问题 3.3子博弈和子博弈完美纳什均衡 34几个经典动态博弈模型 35有同时选择的动态博弈模型 3.6动态博弈分析的问题和扩展讨论 3.1动态博弈的表示法和

2、特点 动态博弈各博弈方先后选择行为,使得其 在表示方法与策略方面与静态博弈有所不 同。3.1.1阶段和扩展性表示 阶段:动态博弈中一个博弈方的一次选择 行另 扩展形可以反映动态博弈中博弈方的选择 次序和博弈的阶段,常用来表示动态博弈 动态博弈的其它名称: 多阶段博弈;序列博弈;扩展形博弈 例子:仿冒和反仿冒博弈 设有一家企业的产品被另一家企业仿冒,如果 被仿冒企业采取措施制止,仿冒企业就会停止 仿冒;否则,它将继续仿冒。 被仿冒企业:理论上,应当采取措施制止仿冒; 现实中,制止仿冒需要代价 仿冒企业:不被制止可能获得利益,但被制止 可能“偷鸡不成蚀把米”。 Hi 3.1.1阶段和扩展性表示 3

3、.1.1阶段和扩展性表示 两个企业在仿冒和制止仿冒的问题上,存在着 一个行为和利益相互储存的博弈问题。它是一 个动态博弈。3.1.1阶段和扩展性表示 当动态博弈的阶段很多,或博弈方在一个 阶段有许多可以选择的行为,此时将难以 用扩展形表示动态博弈,此时常直接用文 字描述和数学函数式表示。如: 下棋博弈 产量博弈A: 3.1.2动态博弈的基本特点 策略是在整个博弈中所有选择、行为的计划; 结果是上述“计划型”策略的策略组合,构成一条路 径; 得益对应每条路径,而不是对应每步选择.行为 一个动态博弈中,博弈的结果包括双方(多方)采用 的策略组合,实现的博弈路径和各博弈方的得益。 有时也用得益矩阵表

4、示动态博弈,但不如扩展形好, 因为其无法反映动态博弈的次序关系,及不同阶段之 间的内在影响和联系。 3.1.2动态博弈的基本特点 先选择、行为的博弈方常常更有利,有“先行优势 FMAW o 后行动的博弈方更具信息优势,但却不一定总能得到 较好的结果。动态博弈动态博弈动态先后次序 3.2可信性和纳什均衡的问题 问题:纳什均衡在动态博弈中失效,关键 是动态博弈中各博弈方策略选择行为上的 “可信性”问题。 3.2.1相机选择和策略中的可信性问题 动态博弈中,各博弈方的策略是他们自己预先设 定的,在各个博弈阶段,针对各种情况的相应行 为选择的计划。这些策略实际上并没有强制力, 而且实施起来有一个过程,

5、因此,只要符合博弈 方自己的利益, 他们完全可以在博弈过程中改变 计划。我们称这种问题为动态博弈中的“相机选 择”(Contingent (Contingent Play)Play)问题。3.2.1相机选择和策略中的可信性问题 开金矿博弈:甲在开采一价值 4 4 万元的金矿时缺丄 万元资金,而乙正好有 1 1万元资金可以投资。设 甲想说服乙将这 1 1 万元资金借给自己用于开矿, 并许诺在釆到金子后与乙对半分成,乙是否该将 钱借给甲呢? 假定金矿的价值无可质疑,乙关心的是:甲采到 3.2.1相机选择和策略中的可信性问题 金后是否会履行诺言跟自己平分。3.2.1相机选择和策略中的可信性问题 不同

6、使合作虽 终不可能。 我们一般假设博弈方 都是以自身利益最大 化为目标,即他们不 考虑道德能把道德左图中,开金矿博弈 为乙1.1.不可信的许诺, 0) 3.2.1相机选择和策略中的可信性问题 要充分保障社会公平和经济活动的效率, 分丸忌公正3.2.1相机选择和策略中的可信性问题 法律制度必须要满足两方面的要求: 对人们正当权益的保护力度足够大; 对侵害他人利益者有足够的震慑作用。 如果达不到这种水平,则法律制度的作用 就是很有限的,甚至完全无效。 J 3.2.1相机选择和策略中的可信性问题 分钱打官司都不可信的情形: (T, 0)的现实 意义:法律诉讼非 常劳民伤财,因此 有时可能打贏官司 只

7、是让被告破财受 一点惩罚(贏了官 司输了钱),在经 济上并不一定合算。 右3.2.2纳什均衡的问题 第三种开金矿博弈中的纳什均衡: (不借不打,不分) (借打,分)不可信,不可能实现或稳定。 注:在双方的策略下,乙第三阶段的“打”并不需要真 正的实施,但因为它是保证第二阶段甲会选择“分”的 关键,因此乙的策略必须包含这个选择。法律 322纳什均衡的问题 纳什均衡在动态博弈可能缺乏稳定性,也就是说,在完 全信息静态博弈中稳定的纳什均衡,在动态博弈中可能 是不稳定的,不能作为预测的基础。 -纳什均衡本身不能排除博弈方策略中包含的不可信的行 为设定,不能解决动态博弈的相机选择引起的可信性问 题 就上

8、例而言,乙在第三阶段“打官司”是不可信的,不可能真 正实施,因为该行为对乙自身也不利,追求自身利益最大化的 乙的理性不允许他这么做。 甲稍做分析,就可以掌握乙的弱点,故不理睬乙“打官司”的 威胁,故在第二阶段选择不分; 乙在第一阶段也自然不会冒险将资金借给甲。 3.2.3逆推归纳法 分析,逐步倒推回前一个阶段相应博弈方的行为选择, 一直到第一个阶段的分析方法,称为“逆推归纳法”。 面阶段选择行为时必然会先考虑后行为博弈方在后面 阶段中将会怎样选择行为,只有在博弈的最后一个阶 段选择的,不再有后续阶段结论 根源 定义, 从动态博逻辑基础: 动态博弈中先行动的理性的博弈方,在前 牵制的博弈方,才能

9、直接 作出明确选择。而当后面阶段惮弈方的选择确定以后, 前一阶段博弈方的行为也就容易确定了。 逆推归纳法是动态博弈分析最重要、基本的方法。 右3.2.3逆推归纳法 法律保障不足开金矿博弈的等价博弈 3.3子博弈和子博弈完美纳什均衡 3.3.1子博弈 3.3.2子博弈完美纳什均衡 3.3.1子博弈 定义:由一个动态博弈第一阶段以外的某阶段 开始的后续博弈阶段构成的,有初始信息集和 进行博弈所需要的全部信息,能够自成一个博 弈的原博弈的一部分,称为原动态博弈的一个 “子博弈”。 么I Iff! F 方的策略构成的一个策略组合满足,在整个动 34几个经典动态博弈模型 3.4.1寡占的斯塔克博格模型

10、3.4.2劳资博弈 3.4.3讨价还价博弈 3.4.4委托人一代理人理论 3.4寡占的斯塔克博格模型 先后选择产量的产量竞争博弈 把古诺模型改为厂商先选择,厂商 2 2 后选择,而 非同时选择即可。 Q = q/ =尸(2) = 8 Q ci = c2= 2 旳二4|P(0)-的二-(+的)-2竹二6 -比 -分 u2=q2P(Q)-c2q2=q2S-(q +q2)-2q2 二6的-屈-彳; 根据逆推归纳法的思路,先分析第二阶段 厂商2的决策。在第二阶段,厂商2决策时 ,厂商丄选择的弔实际上已经决定了,并且 厂商2知道因此,对厂商2来说,相当 于是在给定6_4_2/=0;=3_牛 勿2 2 厂

11、商2对厂商丄产量 的一个反应函数。 34:L寡占的斯塔克博格模型 厂商 1 1 知道厂商 2 2 的决策思路,因此,在选择时 就知道厂商 2 2 的产量 q?q?水会依上述反应函数确定, 所以可以直接将上式代入自己的得益函数,这样, 厂商丄的得益函数实际上转化为自身产量的一元 函数: 旳仏,9;)二 一加;拥=6%-% 3-才-q; 3.4.1寡占的斯塔克博格模型 可见,当把厂商 2 2 的反应函数考虑进来以后,厂 商 1 1 的得益就完全可以由他自己控制了,因此, 他可以直接根据自己的得益函数求出使其最大化 的产量: 得益 厂商丄 3 3 单位 4.54.5 厂商 2 2 丄5 5 单位 2

12、.252.25 启示:在信息不对称的博弈中,信息较多 的博弈方不一定以得到较多的利益。 区别于单人博弈此厂商 2 2 的最佳产量是: =3-1.5 该博弈过程为:先由工会决定工资率,再由厂商 决定雇用多少劳动力 工会代表的劳方效用:“(w“(w 丄) 厂商的利润函数;兀(W(W 丄)=尺(1)1)- -拠 其中:W W:工资率;L L:厂商雇佣的工人数 第一步:先分析第二阶段厂商的选择,即 厂商对工会选择的工资率W的反应函数 L(W) 设工会提出的工资率为 W,W,则厂商实际自己最 大利益的雇佣数 L L 为以下最大值问题。 max 力(W丄)=max7?(L)- WL 对上式关于 L L 求

13、导, 解出 L,L,就是在给定工会选 择工资率 W W时厂商的最优雇佣数量。 一阶导为零Rr(L)-W=O的经济意义:厂商增加雇 佣的边际收益。3.4. 厂商取得最大利润的雇佣数对应的曲线上点A处的切线斜 率一定等于工资率W,在l/(W)处,R(L)与WL间的距 离(正是厂商的利润)最大。 第二步: 分析第一阶段工会的选择。 由于工会了解厂商的决策方法,因此它完全清 楚对应自己选择的每种工资率 W,W,厂商将会选 择的雇佣数一定是由上述方式决定的 L*(W)o L*(W)o 因此,工会需要解决的决策问题变成选择 VT VT ,使它满足如下最大化问题: max uW,LXW) W0 如果给出工会

14、效用函数的具体形式,就可以通 过解这个最大值问题,求出符合工会最大利益 的工资率 WJWJ3.4. 右3.4.3讨价还价博弈 讨价还价;两人就如何分享1万元现金进行谈判, 并定下如下规则: 先由甲提出一个分割比例,对甲提出的比例乙可以接 受也可以拒绝; 如果乙拒绝甲的方案,则他自己应提出另一个方案, 让甲选择接受与否; 只要任何一方接受对方的方案,博弈就结束,而如果 方案被拒绝,则被拒绝方案与以后的讨价还价不再有 关系。 -每一次,一方提出一个方案,与另一方选择是否接受 为一个回合,讨价还价每多进行一个回合,由于谈判 费用和利息损3.4.工会的无差异曲线 失等,双方的利益都要打一个折扣 (其

15、值在O-丄之间,我们称为消耗系数。 右3.4.3讨价还价博弈 三回合讨价还价:在第三回合,乙必须接受甲的方 案。 第三回合,甲出 S,S,双方的利益分别为 JSJS 和 6 62 2(10000(10000- -S)S)(由于乙必须接受,故 S S 通常为 10000)10000) 第二回合,乙的选择。乙知道一旦博弈进行到 第三回合,甲的策略及双方的得益。如果乙已 经拒绝第一回合甲的方案,此时他该怎样出价 才能使自己的利益最大化? 出价时的利益,就愿意接受对方的出价 故乙在第二回合能让甲接受的,也是可能使自己得 最大利益的S2,应满足使甲的二、三回合得益相同 ,此时,乙的得益为8 (10000

16、-8S) o-利用逆推归纳法分析: i则:任何一博弈方只要利益不少于下一回合自己 第一回合: (Sv 100000) 第二回合: (SS2/ S(10000-S2) 第三回合: (82Sf 82(1OOOO-S) 第一回合:甲一开始就知道第三回合的得 益,也知道乙在第二回合的出价,因此, 进行到第三回合自己的得益为而乙则 会满足于得到100005-82S,因此,如果甲 在第一回合就给乙100005-S2S,而同时自 己又能得到比2S更大的利益,那当然是更 理想的。实现这一想法只要令S满足 1OOOO-SX=100008-82S, BPS 10000- 100005-82SBPnTo 甲的得益乙

17、的得益 到了第三回合,甲将提出:S= S= 1000010000 第三第二52S 52(10000-S) SihlOOSihlOO0000 10000 5 10000 5 +5+52 2S=10000(lS=10000(l 6 +56 +52 2) ) 当时,甲得益6 有最大值为 0.250.25 三回合讨价还价博弈结果的讨论 当 0.5610.561 时,越大,甲的得益越大,乙的 得益越小; 当 OvBvO.5OvBvO.5 时,越大,甲的得益越小,乙的 得益越大。 启示:乙仗以讨价还价的筹码:跟甲拖时 间。 现实的例子:利润分配、债务纠纷、财产 继承等。 无限回合讨价还价 与三回合博弈不同

18、的地方在于:无限回合的讨 价还价博弈在第三回合并不会强制结束,只要 双方互不接受对方的出价方案,则博弈就要不 断进行下去,奇数回合由甲出价乙选择是否接 受,偶数则相反。 对于无限回合博弈,从第一回合还是从第三回 合开始,并不影响最终的结果。第三回合出价 第一回合出价 S =10000IOOOO + FS S=S| S = 10000 10000 + ys E 10000 s = 1+5 10000-S* l(XXX) l+s 3-4.4委托人一代理人理论 一、委托人代理人关系 经济活动和社会活动中有很多委托人一代理人 关系,有明显的,也有隐蔽的。工厂和工人.店 主和店员、客户和律师、市民和政府

19、、基金购买 者和基金管理人等都是。 委托人理人关系的关键特征 .不能直接控制,监督不完全,信息不完全,利益的相 关性 根据松散程度、委托内容、监督难易等的不同, 委托人一代理人关系有多种不同的情况,最关键 的差异是监督的难易 流水线装配工的工作比较容易监督,外派采购员保险 推销员等则难; 如果代理人的工作情况在成果中完全反映出来, 则不存在监督问题,因为根据成果完全可判定代 理人的工作情况;但工作成果往往并不完全取决 于代理人的工作情况,如律师努力工作并不难保 证打贏官司, 这种情况下监督问题就不可避免。 由于监督困难的存在,委托人要研究的是:如 何促使代理人的行为符合委托人的利益 激励机制设

20、计、机制设计理论,委托合同设计 问题等委托人代理人涉及问题 二、无不确定性的委托人一代理人模型 假定代理人的工作成果没有不确定性,即 代理人的产出是努力程度的确定性函数。 委任人可以根据成果掌握代理人的工作情 况,不存在监督问题。 委托人的选择是提供或不提供这份合同,并选 择支付给代理人的报酬或报酬函数。 代理人的选择:首先,是否接受合同;其次, 是否努力工作只有努力和偷懒两种情形。 有两种选择的三阶段动态博弈模型,其扩 展形如下图所示:这是一个两个博弈方之间的,每个阶段都 假设种标 占二、无不确定性的委托人一代理人模型 第一阶段:委托人选择是否委托,即是否 向对方提出一个委托合同。 用 R R(0 0)表示没有代理人的服务时委托人的利益 如果委托人选择委托,则由代理人选择。 第二阶段:代理人选择是否接受委托。 如果代理人选择接受委托,还要选择是否努力 第三阶段:代理人选择努力(高努力 水平 )还是偷懒(低努力水平) 三 Isl R(S)-w(S) R(E)-w(E)z w(E)-E

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 社会民生


经营许可证编号:宁ICP备18001539号-1