第14章精炼贝叶斯Nash均衡的精炼.ppt

资源描述

《第14章精炼贝叶斯Nash均衡的精炼.ppt》由会员分享，可在线阅读，更多相关《第14章精炼贝叶斯Nash均衡的精炼.ppt（85页珍藏版）》请在三一文库上搜索。

1、第四部分：不完全信息动态博弈,第十四章精炼贝叶斯Nash均衡的精炼,主要内容：一、精练贝叶斯Nash均衡的精炼二、其它形式的精炼均衡,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,主要内容：一、精练贝叶斯Nash均衡的精炼二、其它形式的精炼均衡,第十四章精炼贝叶斯Nash均衡的精炼,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,一个博弈问题可能存在多个精炼贝叶斯Nas

2、h均衡，需要对精炼贝叶斯Nash均衡进行精炼，最简单和直接的方法就是对非均衡路径上的信念施加一些直观、合理的限制。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,常用的设定参与人在非均衡路径上信念的方法有两种：剔除劣战略法和直观标准。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,1. 剔除劣战略,产生精炼贝叶斯Nash均衡多重性的一个重要原因就是精炼贝叶斯Nash均衡的定义对参与

3、人在非均衡路径上的信念如何设定，没有给出明确的定义或规定。因此，当博弈存在多个精炼贝叶斯Nash均衡时，到底哪一个均衡会实际出现，在很大程度上就依赖于如何定义或规定参与人在非均衡路径上的信念。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,在精炼贝叶斯Nash均衡中，没有参与人的战略包含始于任何信息集的严格劣战略，因此，精炼贝叶斯Nash均衡排除了参与人选择的战略包含始于任何信息集的严格劣战略的可能性。,Control Science and Engineering, HUST All

4、 Rights Reserved, 2007, Luo Yunfeng,在精炼贝叶斯Nash均衡中，任何参与人都不应该认为其他参与人选择严格劣战略(或含有始于某个信息集的严格劣战略的战略)的概率大于0。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,例如:,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,博弈存在两个纯战略Nash均衡(L,L )和 (R,R )；两个纯战略精炼贝叶

5、斯Nash均衡(L,L),p=1)和(R,R ),p1/3),Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,M是参与人l的一个严格劣战略，因此，要让参与人2相信l可能选择了M是不合理的，1-p不可能为正，于是p一定等于l。如果推断1-p0不合理，则(R,R),p1/3)不再是精炼贝叶斯Nash均衡。此时，只有(L,L),p=1)成为满足这一要求的惟一的纯战略精炼贝叶斯Nash均衡。,Control Science and Engineering, HUST All Rights Res

6、erved, 2007, Luo Yunfeng,例如:,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,M并不是参与人2在整个博弈中的严格劣战略，但在参与人1选择A的情况下(即假设参与人1将战略B剔除的情况下)，M却是参与人2在信息集I2(x1)的严格劣战略。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,信息集的严格劣战略:,考虑轮到参与人行动的一个信息集。战略si*为始于这一信

7、息集的严格劣战略，如果存在另一个战略si使得对i在给定信息集可能持有的每一推断，并且对每一其他参与人后续战略可能的组合，i在给定信息集根据si选择行动并在其后根据si选择后续战略得到的收益，严格大于根据si*选择行动和后续战略得到的收益。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,信念精炼标准1(C1)：,在可能的情况下，在每一参与人均衡路径之外的推断中，如果一个节点只有在另一参与人选择始于某些信息集的严格劣战略时，才能够到达，则应认定到达这一节点的概率为0。,Control Sci

8、ence and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,例如:,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,无论参与人i在信息集Ii(xi,xi+1)上的信念如何，R是参与人i在(即始于信息集Ii(xi,xi+1)的后续博弈)上的严格劣战略，因此，根据信念精炼

9、标准1可得：1-p=0，1-q=0。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,注意：,信念精炼标准1只是“在可能的情况下”，作为精炼参与人在均衡路径之外推断的标准，并非任何情况下都适用。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,例如：,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo

10、 Yunfeng,参与人1，M和R都劣于L。在这种情况下，不可能在推断中令到达节点x1和x2的概率都为0，于是信念精炼标准1不再适用。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,对于信号博弈的精练贝叶斯Nash均衡，可将信念精炼标准1重新表述如下。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,在信号博弈中，M中的信号mj称为T中类型ti的劣信号，如果存在另外一个信号mj，使得

11、ti选择mj的最小可能收益大于ti选择mj的最大可能收益，即,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,信号条件(5),如果mj之后的信息集处于均衡路径之外，且mj为类型ti的劣信号，则(在可能的情况下)接收者的推断中，认为发送者的类型为ti的概率应该等于0(只要mj不对T中所有的类型都是劣信号，即为适用这一条件的可能情况)。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,例

12、如：,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,对q1/2，战略和推断(L,L),(u,u),p=0.5,q构成博弈的一个混同精炼贝叶斯Nash均衡。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,由于类型为t1的发送者选择R的最大收益为1，而选择L的最小收益为2，因此，发送者的战略(R, L)和(R, R)为始于类型为t1的发送者的信息集的严格劣战略。所以，根据信号条件(5)

13、，q=0。因此，博弈的精炼贝叶斯Nash均衡(L,L),(u,u),p=0.5, q1/2不满足信号条件(5)。分离精炼贝叶斯Nash均衡(L,R),(u,d),p=1,q=0则自然满足信号条件(5)。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,考察下面的例子：,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,对任意的q值都是一个混同精炼贝叶斯Nash均衡，于是(L,L),(u

14、,u),p=0.5,q=0就是一个满足信号条件(5)的混同精炼贝叶斯Nash均衡。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,对Spence劳动力市场模型的分析可以看到，在模型中存在大量的混同、分离以及杂合精炼贝叶斯Nash均衡。但这些均衡中，并非所有的都能满足信号条件(5)。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,对于Spence劳动力市场模型，在任意的精炼贝叶斯Na

15、sh均衡中，如果工人选择教育水平e，且企业据此推断工人是高能力的概率为，则工人的工资将等于,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,所以，不论企业在观测到e之后所持有的推断如何，低能力工人选择e*(L)的无差异曲线不会在IL的下方，而选择任何ees时的无差异曲线都不会位于IL的上方，因此，根据信号条件(5)，对低能力的工人而言，任何大于es的教育水平e都是劣信号。所以，对，有。,Control Science and Engineering, HUST All Rights

16、 Reserved, 2007, Luo Yunfeng,在此推断下，高能力工人选择任何ees的无差异曲线都位于IH的下方，因此，教育水平es是高能力工人对给定企业的战略与推断的最优反应，所以，高能力工人e=es选择是满足信号条件(5)的分离均衡。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,与此同时，高能力工人选择任何的分离均衡都不能满足信号条件(5)，因为在这样一个均衡中企业必须对任意给出推断，而这与相矛盾。,Control Science and Engineering,

17、 HUST All Rights Reserved, 2007, Luo Yunfeng,该均衡是惟一满足信号条件(5)的分离均衡,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,当均衡满足信号条件(5)时，对因此，在均衡中高能力工人的无差异曲线都不会位于IH的下方。因此，分两种情况讨论满足信号条件(5)的混同及杂合精炼贝叶斯Nash均衡。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunf

18、eng,例如：,假设工人是高能力的概率q足够低，使得工资函数处于高能力工人通过点的无差异曲线IH的下方。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,不存在满足信号条件(5)的混同精炼贝叶斯Nash均衡。,Control Science and Engineering, HUST All Rights Reserved, 2007

19、, Luo Yunfeng,不存在满足信号条件(5)的杂合精炼贝叶斯Nash均衡。首先，不存在高能力工人随机选择信号的杂合均衡。其次，也不存在低能力工人随机选择信号的杂合均衡,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,不存在高能力工人随机选择信号的杂合均衡,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,不存在低能力工人随机选择信号的杂合均衡,Control Science

20、and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,再例如：,假设工人是高能力的概率q足够高，使得工资函数与高能力工人通过点的无差异曲线相交。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,给定的生产函数和无差异曲线如下图1和图2所示,图1,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,给定的生产函数和无差

21、异曲线如下图1和图2所示,图2,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,因此，有以下结论：,不存在低能力工人随机选择信号且满足信号条件(5)的杂合均衡。存在满足信号条件(5)的混同均衡，混同教育水平ep满足：。存在高能力工人随机选择信号且满足信号条件(5)的杂合均衡，混同发生点位于图2中阴影区域之内。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,2.直观标准,利用

22、剔除劣战略的方法(即根据信念精炼标准1)，可以将许多不合理的精炼贝叶斯Nash均衡剔除掉，但是，在信号博弈中，仍可发现许多满足信号条件(5)但却与直觉不相符的均衡。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,例如：“啤酒或热狗”信号博弈,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,各方收益情况表现出如下特征：,软弱类型发送者偏好选择热狗作早餐，粗暴类型发送者偏好啤酒；与早餐

23、吃什么相比，两种类型发送者更关心是否与接收者发生冲突；接收者则偏好与软弱类型发送者挑起冲突，但不希望与粗暴类型发送者挑起冲突。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,在这一博弈中，(热狗, 热狗), (不冲突, 冲突), p=0.1,q1/2 构成一个混同精炼贝叶斯Nash均衡，而且这一均衡满足信号条件(5)，因为啤酒对两种类型的发送者都不是劣信号。,Control Science and Engineering, HUST All Rights Reserved, 2007,

24、 Luo Yunfeng,但是，上述均衡要求：如果接收者意料之外地观测到啤酒，则他推测发送者至少有一半的可能性是软弱型(即q1/2)，这种推断十分令人怀疑。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,均衡劣信号,给定信号博弈中的一个精炼贝叶斯Nash均衡，M中的信号mj称为T中类型ti的均衡劣信号，如果ti的均衡收益u*(ti)，大于ti选择mj时最大的可能收益，即,Control Science and Engineering, HUST All Rights Reserved,

25、2007, Luo Yunfeng,信号条件(6)直观标准,在可能的情况下，如果mj之后的信息集处于均衡路径之外，且mj为类型ti的均衡劣信号，则接收者的推断中分配给类型ti的概率应该等于0 (如果mj不对T中所有的类型都是均衡劣信号，即属要求中的“可能情况”)。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,“啤酒或热狗”证明了一个信号mj可以是ti的均衡劣信号，即使它不是ti的劣信号。不过，如果mj为ti的劣信号，则mj一定为ti的均衡劣信号，于是信号条件(6)的限定使得信号条件(

26、5)成为多余。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,例如：考察下图所示的混同的均衡,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,不存在满足信号条件(6)的混同精炼贝叶斯Nash均衡。也不存在满足信号条件(6)的杂合均衡。于是，满足信号条件(6)的惟一精炼贝叶斯Nash均衡就是下图所示的分离均衡。,Control Science and Engineering, HU

27、ST All Rights Reserved, 2007, Luo Yunfeng,惟一精炼贝叶斯Nash均衡分离均衡,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,主要内容：一、精练贝叶斯Nash均衡的精炼二、其它形式的精炼均衡,第十四章精炼贝叶斯Nash均衡的精炼,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,对于不完全信息博弈，除了定义精炼贝叶斯Nash均衡以外，还可以

28、用其它的方式定义精炼均衡。下面介绍两种常用的精炼均衡，一种是定义在扩展式博弈上的序贯均衡，一种是定义在战略式博弈上的颤抖手精炼均衡。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,1.序贯均衡,Kreps和Wilson(1982)定义在扩展式博弈上的一种新的精炼均衡序贯均衡(sequential equilibrium)，最大优点就在于它可以将贝叶斯法则应用于任何博弈路径(包括均衡路径和非均衡路径)，克服精炼贝叶斯Nash均衡中当零概率事件发生时无法修正后验概率的不足。,Control

29、Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,给定一个扩展式博弈，用X表示决策结的集合，表示一个特定的决策结，Ii(x)表示参与人i的包含决策结x的信息集；i(|x)表示参与人i在x(或Ii(x)上的混合战略，表示所有战略组合(1, 2, n)的集合。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,给定，P(x)和P(Ii(x)分别表示博弈到达决策结x和信息集Ii(x)的概率。 (x)表示给

30、定博弈到达信息集Ii(x)的情况下参与人i在Ii(x)上的信念(即概率分布)，表示所有(x)的集合(即信念系统)。 ui(| Ii(x), (x)表示参与人i在Ii(x)上的期望效用。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,给定一个混合战略，如果对于所有的信息集I和，，即参与人i选择每一个行动的概率严格为正，则为一个严格混合战略。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunf

31、eng,令表示所有严格混合战略组合的集合，若，则对于所有的决策结x，，因此，贝叶斯法则在每一个信息集上都有定义：,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,序贯均衡,(,)是一个序贯均衡，如果它满足下列两个条件： (S) (,)是序贯理性的(sequential rational)，即对于所有的信息集Ii(x)和任何可选择的战略i，； (C) (,)是一致的(consisitent)，即存在一个严格混合战略组合序列m和贝叶斯法则决定的概率序列m，使得(,)是(m,m)的极限即

32、。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,例子：,当博弈到达参与人1的信息集时，参与人1认为(x)=1/3 ，(x)=2/3。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,无论处于哪一个决策结，参与人1的最优战略都是U，因此，参与人2的信息集是非均衡路径。,Control Science and Engineering, HUST All Rights Reserved

33、, 2007, Luo Yunfeng,如果参与人1偏离均衡选择D，参与人2的后验概率应该如何设定呢？因为参与人1不能区分x和x，所以，可以认为参与人1在两个决策结上偏离的可能性都是一样的。在这种情况下，参与人2的信念可以设为(y)=1/3 ，(y)=2/3 。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,如果根据精炼贝叶斯Nash均衡的定义，就无法对参与人2的这种信念给出合理的解释，因为选择D是零概率事件，参与人2的任何信念(y)都与贝叶斯法则相容。但是，序贯均衡中一致性条件(C

34、)却可以给出正确的结论。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,考虑收敛于0的序列 (其中 )，并将解释为参与人1“颤抖”并继续博弈下去的概率。对于这个序列,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,参与人1从决策结x“颤抖”地到达y的概率为，从决策结x “颤抖”地到达y的概率为，参与人1不能区分x和x，所以参与人2相信“颤抖”地到达y的概率应为上式所示的条件概率

35、。这样，“颤抖”就保证了参与人2的后验概率尊重了原来的信息结构。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,Fudenberg和Tirole(1991)证明：在多阶段不完全信息博弈中，如果每个参与人最多只有两个类型，或者博弈只有两个阶段，那么精炼贝叶斯Nash均衡与序贯均衡是重合的。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,Kreps和Wilson(1982)证明：在“几

36、乎所有的”博弈中，序贯均衡与精炼贝叶斯Nash均衡是相同的。由于要检查一个给定的“评估” (,)是否满足一致性条件是非常繁琐，相对而言，精炼贝叶斯Nash均衡更为直观和容易定义，所以，习惯上大多数学者喜欢使用精炼贝叶斯Nash均衡这个概念而不是序贯均衡。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,2. 颤抖手精炼均衡,“颤抖手精炼均衡”(trembling-hand perfect equilibrium)是Selten在改进子博弈精炼Nash均衡时提出的一种精炼均衡。它的基本思想

37、是，在任何一个博弈中，每一个参与人都有一定的可能性犯错误；一个战略组合，只有当它在允许所有参与人都可能犯错误时仍是每一个参与人的最优战略组合时，才是一个均衡。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,给定一个战略式博弈，对参与人i的某个战略i，我们可以对任意固定的正数0构造一个严格混合战略，使得对如果当趋于0时，收敛于i(即 )。此时，严格混合战略序列就是参与人i采用战略i时发生的颤抖。,Control Science and Engineering, HUST All R

38、ights Reserved, 2007, Luo Yunfeng,颤抖可以解释为参与人i采用战略i时发生了“小错误”。设(1, 2, n)，严格混合战略组合序列即为参与人采用战略组合时发生的颤抖。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,颤抖手精炼均衡,在给定的战略式博弈中，Nash均衡=(1, 2, n)是一个颤抖手精炼均衡，如果对于每一个参与人i，存在一个严格混合战略序列，使得下列条件满足：对于每一个i ，；对于每一个i，和任意固定的正数 0, i是对战略组合的

39、最优反应，即对任何可选择的混合战略，。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,颤抖手精炼均衡可以这样理解：每一个参与人i预期其他参与人选择-i，并准备选择自己的最优战略；但每个参与人i怀疑其他参与人可能错误地选择。如果每一个参与人i所犯错误很小并且错误收敛于0，那么每一个参与人i准备选择的战略i不仅在其他参与人不犯错误时是最优的，而且在其他参与人错误地选择了时也是最优的(即定义中条件(2)。,Control Science and Engineering, HUST A

40、ll Rights Reserved, 2007, Luo Yunfeng,例如：,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,博弈存在两个纯战略Nash均衡(L1,R2)和(R1,L2)。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,考察均衡(L1,R2),假设参与人2选择行动R2时发生颤抖，其颤抖 (其中 )。若 (即参与人2犯错误的可能性不大于1/2)，则假设参与人1

41、选择行动L1时发生颤抖，其颤抖，由于R2为参与人2的占优战略，因此。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,(L1,R2)为颤抖手精炼均衡。同理可以证明，(R1,L2)不是颤抖手精炼均衡。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,关于颤抖手精炼均衡的存在性，Selten证明：对于有限的战略式博弈，至少存在一个颤抖手精炼均衡。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,颤抖手精炼均衡与序贯均衡的关系,Kreps和wilson(1982)证明：颤抖手精炼均衡是序贯均衡，但序贯均衡不一定是颤抖手精炼均衡。然而，对普通的博弈，这两个概念是一致的。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,本章结束,

展开阅读全文