03完全且完美信息动态博弈汇总.doc

资源描述

《03完全且完美信息动态博弈汇总.doc》由会员分享，可在线阅读，更多相关《03完全且完美信息动态博弈汇总.doc（30页珍藏版）》请在三一文库上搜索。

1、经济博弈论完全且完美信息动态博弈本部分内容简介讨论动态博弈，所有博弈方都对博弈过程和得益完全了解的完全且完美信息动态博弈。动态博弈与静态博弈的区别主要体现在博弈方的选择、行为有先后次序等方面，故它们在表示方法、利益关系、分析方法和均衡概念等有所不同。 2.2.介绍动态博弈分析的概念和方法，特别是子博弈完美均衡和逆推归纳法,并介绍各种经典的动态博弈模型。本部分主要内容 3.1动态博弈的表示法和特点 3.2可信性和纳什均衡的问题 3.3子博弈和子博弈完美纳什均衡 34几个经典动态博弈模型 35有同时选择的动态博弈模型 3.6动态博弈分析的问题和扩展讨论 3.1动态博弈的表示法和

2、特点动态博弈各博弈方先后选择行为，使得其在表示方法与策略方面与静态博弈有所不同。3.1.1阶段和扩展性表示阶段：动态博弈中一个博弈方的一次选择行另扩展形可以反映动态博弈中博弈方的选择次序和博弈的阶段，常用来表示动态博弈动态博弈的其它名称：多阶段博弈；序列博弈；扩展形博弈例子：仿冒和反仿冒博弈设有一家企业的产品被另一家企业仿冒，如果被仿冒企业采取措施制止，仿冒企业就会停止仿冒；否则，它将继续仿冒。被仿冒企业：理论上，应当采取措施制止仿冒; 现实中，制止仿冒需要代价仿冒企业：不被制止可能获得利益，但被制止可能“偷鸡不成蚀把米”。 Hi 3.1.1阶段和扩展性表示 3

3、.1.1阶段和扩展性表示两个企业在仿冒和制止仿冒的问题上，存在着一个行为和利益相互储存的博弈问题。它是一个动态博弈。3.1.1阶段和扩展性表示当动态博弈的阶段很多，或博弈方在一个阶段有许多可以选择的行为，此时将难以用扩展形表示动态博弈，此时常直接用文字描述和数学函数式表示。如：下棋博弈产量博弈A： 3.1.2动态博弈的基本特点策略是在整个博弈中所有选择、行为的计划; 结果是上述“计划型”策略的策略组合，构成一条路径；得益对应每条路径，而不是对应每步选择.行为一个动态博弈中，博弈的结果包括双方（多方）采用的策略组合，实现的博弈路径和各博弈方的得益。有时也用得益矩阵表

4、示动态博弈，但不如扩展形好，因为其无法反映动态博弈的次序关系，及不同阶段之间的内在影响和联系。 3.1.2动态博弈的基本特点先选择、行为的博弈方常常更有利，有“先行优势 FMAW o 后行动的博弈方更具信息优势，但却不一定总能得到较好的结果。动态博弈动态博弈动态先后次序 3.2可信性和纳什均衡的问题问题：纳什均衡在动态博弈中失效，关键是动态博弈中各博弈方策略选择行为上的 “可信性”问题。 3.2.1相机选择和策略中的可信性问题动态博弈中，各博弈方的策略是他们自己预先设定的，在各个博弈阶段，针对各种情况的相应行为选择的计划。这些策略实际上并没有强制力，而且实施起来有一个过程，

5、因此，只要符合博弈方自己的利益，他们完全可以在博弈过程中改变计划。我们称这种问题为动态博弈中的“相机选择”(Contingent (Contingent Play)Play)问题。3.2.1相机选择和策略中的可信性问题开金矿博弈：甲在开采一价值 4 4 万元的金矿时缺丄万元资金，而乙正好有 1 1万元资金可以投资。设甲想说服乙将这 1 1 万元资金借给自己用于开矿，并许诺在釆到金子后与乙对半分成，乙是否该将钱借给甲呢？假定金矿的价值无可质疑，乙关心的是：甲采到 3.2.1相机选择和策略中的可信性问题金后是否会履行诺言跟自己平分。3.2.1相机选择和策略中的可信性问题不同

6、使合作虽终不可能。我们一般假设博弈方都是以自身利益最大化为目标，即他们不考虑道德能把道德左图中，开金矿博弈为乙1.1.不可信的许诺, 0) 3.2.1相机选择和策略中的可信性问题要充分保障社会公平和经济活动的效率, 分丸忌公正3.2.1相机选择和策略中的可信性问题法律制度必须要满足两方面的要求: 对人们正当权益的保护力度足够大; 对侵害他人利益者有足够的震慑作用。如果达不到这种水平，则法律制度的作用就是很有限的，甚至完全无效。 J 3.2.1相机选择和策略中的可信性问题分钱打官司都不可信的情形：（T, 0）的现实意义：法律诉讼非常劳民伤财，因此有时可能打贏官司只

7、是让被告破财受一点惩罚（贏了官司输了钱），在经济上并不一定合算。右3.2.2纳什均衡的问题第三种开金矿博弈中的纳什均衡：（不借不打，不分）（借打，分）不可信，不可能实现或稳定。注：在双方的策略下，乙第三阶段的“打”并不需要真正的实施，但因为它是保证第二阶段甲会选择“分”的关键，因此乙的策略必须包含这个选择。法律 322纳什均衡的问题纳什均衡在动态博弈可能缺乏稳定性，也就是说，在完全信息静态博弈中稳定的纳什均衡，在动态博弈中可能是不稳定的，不能作为预测的基础。 -纳什均衡本身不能排除博弈方策略中包含的不可信的行为设定，不能解决动态博弈的相机选择引起的可信性问题就上

8、例而言，乙在第三阶段“打官司”是不可信的，不可能真正实施，因为该行为对乙自身也不利，追求自身利益最大化的乙的理性不允许他这么做。甲稍做分析，就可以掌握乙的弱点，故不理睬乙“打官司”的威胁，故在第二阶段选择不分；乙在第一阶段也自然不会冒险将资金借给甲。 3.2.3逆推归纳法分析，逐步倒推回前一个阶段相应博弈方的行为选择, 一直到第一个阶段的分析方法，称为“逆推归纳法”。面阶段选择行为时必然会先考虑后行为博弈方在后面阶段中将会怎样选择行为，只有在博弈的最后一个阶段选择的，不再有后续阶段结论根源定义, 从动态博逻辑基础: 动态博弈中先行动的理性的博弈方，在前牵制的博弈方，才能

9、直接作出明确选择。而当后面阶段惮弈方的选择确定以后, 前一阶段博弈方的行为也就容易确定了。逆推归纳法是动态博弈分析最重要、基本的方法。右3.2.3逆推归纳法法律保障不足开金矿博弈的等价博弈 3.3子博弈和子博弈完美纳什均衡 3.3.1子博弈 3.3.2子博弈完美纳什均衡 3.3.1子博弈定义：由一个动态博弈第一阶段以外的某阶段开始的后续博弈阶段构成的，有初始信息集和进行博弈所需要的全部信息，能够自成一个博弈的原博弈的一部分，称为原动态博弈的一个 “子博弈”。么I Iff! F 方的策略构成的一个策略组合满足，在整个动 34几个经典动态博弈模型 3.4.1寡占的斯塔克博格模型

10、3.4.2劳资博弈 3.4.3讨价还价博弈 3.4.4委托人一代理人理论 3.4寡占的斯塔克博格模型先后选择产量的产量竞争博弈把古诺模型改为厂商先选择，厂商 2 2 后选择，而非同时选择即可。 Q = q/ =尸(2) = 8 Q ci = c2= 2 旳二4|P(0)-的二-(+的)-2竹二6 -比 -分 u2=q2P(Q)-c2q2=q2S-(q +q2)-2q2 二6的-屈-彳；根据逆推归纳法的思路，先分析第二阶段厂商2的决策。在第二阶段，厂商2决策时 ,厂商丄选择的弔实际上已经决定了，并且厂商2知道因此，对厂商2来说，相当于是在给定6_4_2/=0；=3_牛勿2 2 厂

11、商2对厂商丄产量的一个反应函数。 34：L寡占的斯塔克博格模型厂商 1 1 知道厂商 2 2 的决策思路，因此，在选择时就知道厂商 2 2 的产量 q?q?水会依上述反应函数确定，所以可以直接将上式代入自己的得益函数，这样, 厂商丄的得益函数实际上转化为自身产量的一元函数: 旳仏，9；）二一加；拥=6%-% 3-才-q； 3.4.1寡占的斯塔克博格模型可见，当把厂商 2 2 的反应函数考虑进来以后，厂商 1 1 的得益就完全可以由他自己控制了，因此，他可以直接根据自己的得益函数求出使其最大化的产量: 得益厂商丄 3 3 单位 4.54.5 厂商 2 2 丄5 5 单位 2

12、.252.25 启示：在信息不对称的博弈中，信息较多的博弈方不一定以得到较多的利益。区别于单人博弈此厂商 2 2 的最佳产量是: =3-1.5 该博弈过程为：先由工会决定工资率，再由厂商决定雇用多少劳动力工会代表的劳方效用：“(w“(w 丄) 厂商的利润函数；兀(W(W 丄)=尺(1)1)- -拠其中：W W：工资率；L L：厂商雇佣的工人数第一步：先分析第二阶段厂商的选择，即厂商对工会选择的工资率W的反应函数 L(W) 设工会提出的工资率为 W,W,则厂商实际自己最大利益的雇佣数 L L 为以下最大值问题。 max 力(W丄)=max7?(L)- WL 对上式关于 L L 求

13、导，解出 L,L,就是在给定工会选择工资率 W W时厂商的最优雇佣数量。一阶导为零Rr(L)-W=O的经济意义：厂商增加雇佣的边际收益。3.4. 厂商取得最大利润的雇佣数对应的曲线上点A处的切线斜率一定等于工资率W,在l/(W)处，R(L)与WL间的距离(正是厂商的利润)最大。第二步：分析第一阶段工会的选择。由于工会了解厂商的决策方法，因此它完全清楚对应自己选择的每种工资率 W,W,厂商将会选择的雇佣数一定是由上述方式决定的 L*(W)o L*(W)o 因此，工会需要解决的决策问题变成选择 VT VT ,使它满足如下最大化问题： max uW,LXW) W0 如果给出工会

14、效用函数的具体形式，就可以通过解这个最大值问题，求出符合工会最大利益的工资率 WJWJ3.4. 右3.4.3讨价还价博弈讨价还价；两人就如何分享1万元现金进行谈判, 并定下如下规则：先由甲提出一个分割比例，对甲提出的比例乙可以接受也可以拒绝; 如果乙拒绝甲的方案，则他自己应提出另一个方案, 让甲选择接受与否；只要任何一方接受对方的方案，博弈就结束，而如果方案被拒绝，则被拒绝方案与以后的讨价还价不再有关系。 -每一次，一方提出一个方案，与另一方选择是否接受为一个回合，讨价还价每多进行一个回合，由于谈判费用和利息损3.4.工会的无差异曲线失等，双方的利益都要打一个折扣（其

15、值在O-丄之间，我们称为消耗系数。右3.4.3讨价还价博弈三回合讨价还价：在第三回合，乙必须接受甲的方案。第三回合，甲出 S,S,双方的利益分别为 JSJS 和 6 62 2(10000(10000- -S)S)(由于乙必须接受，故 S S 通常为 10000)10000) 第二回合，乙的选择。乙知道一旦博弈进行到第三回合，甲的策略及双方的得益。如果乙已经拒绝第一回合甲的方案，此时他该怎样出价才能使自己的利益最大化？出价时的利益，就愿意接受对方的出价故乙在第二回合能让甲接受的，也是可能使自己得最大利益的S2,应满足使甲的二、三回合得益相同 ,此时，乙的得益为8 (10000

16、-8S) o-利用逆推归纳法分析: i则：任何一博弈方只要利益不少于下一回合自己第一回合： (Sv 100000) 第二回合： (SS2/ S(10000-S2) 第三回合： (82Sf 82(1OOOO-S) 第一回合：甲一开始就知道第三回合的得益，也知道乙在第二回合的出价，因此，进行到第三回合自己的得益为而乙则会满足于得到100005-82S,因此，如果甲在第一回合就给乙100005-S2S,而同时自己又能得到比2S更大的利益，那当然是更理想的。实现这一想法只要令S满足 1OOOO-SX=100008-82S, BPS 10000- 100005-82SBPnTo 甲的得益乙

17、的得益到了第三回合，甲将提出：S= S= 1000010000 第三第二52S 52(10000-S) SihlOOSihlOO0000 10000 5 10000 5 +5+52 2S=10000(lS=10000(l 6 +56 +52 2) ) 当时，甲得益6 有最大值为 0.250.25 三回合讨价还价博弈结果的讨论当 0.5610.561 时，越大，甲的得益越大，乙的得益越小；当 OvBvO.5OvBvO.5 时，越大，甲的得益越小，乙的得益越大。启示：乙仗以讨价还价的筹码：跟甲拖时间。现实的例子：利润分配、债务纠纷、财产继承等。无限回合讨价还价与三回合博弈不同

18、的地方在于：无限回合的讨价还价博弈在第三回合并不会强制结束，只要双方互不接受对方的出价方案，则博弈就要不断进行下去，奇数回合由甲出价乙选择是否接受，偶数则相反。对于无限回合博弈，从第一回合还是从第三回合开始，并不影响最终的结果。第三回合出价第一回合出价 S =10000IOOOO + FS S=S| S = 10000 10000 + ys E 10000 s = 1+5 10000-S* l(XXX) l+s 3-4.4委托人一代理人理论一、委托人代理人关系经济活动和社会活动中有很多委托人一代理人关系，有明显的，也有隐蔽的。工厂和工人.店主和店员、客户和律师、市民和政府

19、、基金购买者和基金管理人等都是。委托人理人关系的关键特征 .不能直接控制，监督不完全，信息不完全，利益的相关性根据松散程度、委托内容、监督难易等的不同，委托人一代理人关系有多种不同的情况，最关键的差异是监督的难易流水线装配工的工作比较容易监督，外派采购员保险推销员等则难；如果代理人的工作情况在成果中完全反映出来，则不存在监督问题，因为根据成果完全可判定代理人的工作情况；但工作成果往往并不完全取决于代理人的工作情况，如律师努力工作并不难保证打贏官司，这种情况下监督问题就不可避免。由于监督困难的存在，委托人要研究的是：如何促使代理人的行为符合委托人的利益激励机制设

20、计、机制设计理论，委托合同设计问题等委托人代理人涉及问题二、无不确定性的委托人一代理人模型假定代理人的工作成果没有不确定性，即代理人的产出是努力程度的确定性函数。委任人可以根据成果掌握代理人的工作情况，不存在监督问题。委托人的选择是提供或不提供这份合同，并选择支付给代理人的报酬或报酬函数。代理人的选择：首先，是否接受合同；其次，是否努力工作只有努力和偷懒两种情形。有两种选择的三阶段动态博弈模型，其扩展形如下图所示：这是一个两个博弈方之间的，每个阶段都假设种标占二、无不确定性的委托人一代理人模型第一阶段：委托人选择是否委托，即是否向对方提出一个委托合同。用 R R（0 0）表示没有代理人的服务时委托人的利益如果委托人选择委托，则由代理人选择。第二阶段：代理人选择是否接受委托。如果代理人选择接受委托，还要选择是否努力第三阶段：代理人选择努力（高努力水平）还是偷懒（低努力水平）三 Isl R(S)-w(S) R(E)-w(E)z w(E)-E

展开阅读全文