ImageVerifierCode 换一换
格式:DOCX , 页数:101 ,大小:611.23KB ,
资源ID:201630      下载积分:5 金币
已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  
下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(《博弈论与经济模型》讲义第三章完全信息静态博弈.docx)为本站会员(奥沙丽水)主动上传,三一文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三一文库(发送邮件至doc331@126.com或直接QQ联系客服),我们立即给予删除!

《博弈论与经济模型》讲义第三章完全信息静态博弈.docx

1、第三章完全信息静态博弈正如我们在第二章中所指出的那样,局中人在博弈中所享有的信息量对于博弈的结果有着重大的影响,博弈中的信息对称程度(或不对称程度)也决定着博弈的特征和结果。除此之外,博弈中各局中人在选择其行动时的先后顺序也决定着博弈的特征和结果。譬如,有两个销售同样产品的销售商A和B打算进入某一区域性市场。由于这个区域市场对产品的需求是有限的,当他们都同时进入该区域市场时,他们各自占有的市场规模都偏小,从而造成1个单位的亏损;但是,当只有一个销售商进入该区域性市场时,则获得1个单位的利润;当然,不进入市场时的利润为零。假如A和B同时进行决策或者他们在进行各自的决策时并不知道另一方的选择,则博

2、弈就被称为是一种“静态”博弈,刻划它们的支付情况的矩阵被称为“支付矩阵”,见表3.1。表3.1市场进入的静态博弈B进入不进入-1,-11,00,10,0A和B的行动选择范围都是“进入”或“不进入”。当B选择“进入”时,A的最优行动选择是“不进入”,而给定A选择“不进入”时,B的最优选择是“进入”。因此,不进入,进入是一个纳什均衡。类似地,进入,不进入也是另一个纳什均衡。图3.1市场进入的动态博弈:A先行动下面,我们将这个博弈作一种修改,假定博弈是“动态”的,即A和B在行动选择上有“先”与“后”的顺序。假定A先选择,B在A完成了其选择后再进行自己的行动选择,并且B在进行行动选择前知道A的选择结果

3、此时,我们用图3.1来表示这个博弈。在图3.1中,空心和实心的小圆点被称为决策结(decisionnodes),位于决策结旁边的字母代表在这个决策结处进行行动选择的局中人,该局中人在此决策结处进行行动选择。通常,整个博弈中进行第一个行动选择的决策结用空心圆点表示。图中的线段被称为“枝”(branches),一个枝表示位于该枝上端决策结处的局中人在该决策结可能选择的一个“行动”。最下方的枝的下端被称为终点结(terminalnodes),当博弈进行到任一终点结时,博弈过程就告结束。终点结处的向量表示博弈进行到此处从而结束博弈时局中人的支付,向量中从左端数起第一个数字是最先行动的局中人的支付,第

4、二个数是第二行动的局中人的支付等等。每一个枝旁边的文字指出了该枝代表的行动。博弈的行动顺序在图中是从“上”到“下”,现在,我们来看看这个博弈的“均衡”是什么。当A选“进入”时,B接着就会选“不进入”;当A选“不进入”时,B接着选的是“进入”。A比较两种选择所获得支付,从而选择“进入”。于是,博弈只有一个“均衡”,即进入,不进入。均衡结果是:A选“进入”,B选“不进入”。图3.1中的几何图形常被称为“博弈树”。显然,行动有先后之分的“动态”博弈与“静态”博弈相比会给出不同的预测结果。下面,我们再将上述“动态”博弈中局中人A和B的行动顺序作一下修改,即假设B先行动,A在观察到了B的行动选择后,再进

5、行自己的行动选择。我们用图3.2来表示这个博弈。图3.2市场进入的动态博弈:B先行动显而易见,图3.2与图3.1所表达的博弈相比除行动的先后顺序不同外,其他结构特征完全相同。所以,均衡结果是:A选“不进入”,B选“进入。这样,我们看到,博弈的行动顺序会影响博弈的预测结果。我们通常将支付矩阵(或代数形式)表达博弈的方式称为博弈的“战略式”表述(strategicformrepresentation)或标准式表述(normalformrepresentation),而将用图3.1和图3.2中那种“博弈树”表达博弈的方式称为博弈的“扩展式”表述(extensiveformrepresentation

6、)0两种表述方法本质上是相同的,但通常用战略式表述表达静态博弈较为方便,而动态博弈用“扩展式表述”更为直观一些。譬如,我们用表3.2中的战略式表述来表示由图3.1给出的动态博弈。-1,-1-1,-11,01,00,10,00,10,0表3.2用战略式表述表示图3.1中的动态博弈B(进入,进入进入,不进入不进入,进入不进入,不进入进入不进入此时,需要注意的是,这时B的每一个选择或战略都必须给出任何情况下(无论其是否真正可能出现)自己的行动选择。在表3.2中,B有4种选择或战略,每一个战略用一个向量表示,向量中左端第一个行动选择对应于A选“进入”时B的行动选择,第二个行动选择对应于A选“不进入”时

7、B的行动选择。给定A选“进入”,B的最优选择是不进入,进入和不进入,不进入。当B选不进入,进入时,A的最优选择是“进入”,当B选不进入,不进入时,A的最优选择是“进入”;当A选“不进入”时,B的最优选择是进入,进入和不进入,进入;当B选进入,进入时,A的最优选择是“不进入”;当B选不进入,进入时,A的最优选择是“进入”。所以,有三个纳什均衡:进入,(不进入,进入),进入,(不进入,不进入)和不进入,(进入,进入),均衡的结果为:A进入,B不进入和A不进入,B进入。“均衡结果”指A和B的均衡战略组合下的预测的A和B的行动组合,“均衡”指均衡战略的组合,两者是不同的概念。显然,在这里,多个不同均衡

8、可以带来相同的均衡结果。细心的读者会发现:表3.2中用战略式表述的纳什均衡比图3.1中用扩展式表述的均衡多出一个,即不进入,(进入,进入),其均衡结果为A不进入,B进入。这个均衡实际上是不可信的,因为B威胁无论A是否进入他都要进入,若A相信B的威胁,给定B无论如何要进入,A的最优选择当然就是不进入。但是,A怎么能相信B的威胁呢?因为,只要A选择了“进入”,B的最优选择就是“不进入”而不是“进入”。所以,在我们对局中人的理性行为假定下(而这正是博弈论的假定前提),应该预测A会选“进入”而B选“不进入”。所以,这个多出来的均衡应去掉。显然,当用战略式表述表达动态博弈时,可能将一些不可信的均衡包括进

9、来,所以在动态博弈分析中常用的表述方式是扩展式而不是战略式表述。在这里,不可信的均衡中含有B对A的不可置信的威胁,应该从预测的均衡中去掉。我们将在第五章中对这个问题展开详细的讨论,并给出在较为一般的情况下去除这类甚至包括其他不可信均衡的方法,而剩下的均衡被称为“子博弈精炼纳什均衡“(sub-gamePerfectNashequilibrium)o类似地,也可用扩展式表述去表达静态博弈,两种表述方式是等价的。我们在本章将专注于介绍局中人同时作出决策或者局中人在进行决策时不能观察到其他局中人的决策且不存在信息不对称的博弈模型,这类模型表示的博弈被称为“完全信息静态博弈”(perfectinform

10、ationstaticgame)3.1 博弈模型的战略式表述战略式表述的博弈模型需要在以下几个要素内容方面作出明确的确定,即局中人(player)也称为参与人,指参与博弈的成员,可以是作为自然人的个人,也可以是企业、团体、组织机构、国家甚至国际联盟组织等。博弈论假定局中人是追求效用最大化的理性人。当局中人是企业、团体、组织机构甚至国家时,假定构成这类组织的自然人也是追求效用最大化的理性人。在具体的分析中,可以用利润最大化或其他目标函数来代替效用最大化,但这些不同的目标函数之间并不存在矛盾,它们都应被理解以效用最大化为一致性基础的相互可替代的表达方式。记n为一个博弈中局中人的个数(n=l,2,A

11、),T为所有局中人构成的集合,T二(1,2,A,n),i为一个特定的局中人(i=l,2,A,n),iI;一个特别的局中人可能是“自然”,它是我们上述规定的例外,因为它既不是自然人也不是由自然人构成的组织,同时也不是追求效用最大化的行为主体,它往往表示一种博弈面临的环境或外生条件。战略空间(strategyspace)每一个局中人可以选择的战略所构成的集合。一个战略(Strategy)是指局中人选择行动的规则,而行动是指局中人的决策变量。一个战略告诉局中人在什么时候选择什么行动。譬如,毛泽东在制订中国与其他国家之间的军事战略时就通过十六个字简明扼要地概括出其主要思想:“人不犯我,我不犯人,人若犯

12、我,我必犯人”。在这个战略中,“犯”与“不犯”是两种不同的行动,该战略规定了什么时候选择“犯”,什么时候选择“不犯”。记第i个局中人的战略空间为S;记S,中的一个元素为s,eS,iT;信息一一指局中人在博弈中拥有的相关知识,特别是有关其他局中人的特征和行动的知识。支付函数一一指局中人从博弈中获得的效用水平或利润水平或其他形式的目标函数。根据我们在前面给出的说明,无论是什么样形式的支付函数,它们一般都是以效用函数作为其基础的。结果一一这是一个内容较为广泛的概念,通常指研究者对博弈结束时所带来的各种感兴趣的效应或要素的集合,记第i个局中人的支付函数为u,=u,(s,A,s,A,S4),iT,局中人

13、的支付不仅是该局中人自己所选战略的函数,而且还是所有其他局中人选择的战略的函数,这正是博弈论所强调的互动效应的数学描述。均衡所有局中人都选择的最优战略或行动的组合。在博弈论中,有不同的均衡概念,但基础性的均衡概念指的是“纳什均衡”。我们一般将局中人、行动、结果统称为博弈规则,一个具体的博弈规则将决定相应的博弈均衡(但均衡不一定是唯一的)。我们将一个博弈记为G=S,A,S,;u1,A,称这种表述方法为一个博弈的“战略式表述“(strategicformrepresentation)o我们在研究中经常会遇到一类较为简单的博弈,称为有限博弈,其定义如下:定义3.1当局中人的个数n为有限数且每个局中人

14、的战略空间中的元素只有限个时,称博弈为有限博弈(finitegame)o显然,我们在第二章中给出的“囚徒困境”博弈,“市场进入”博弈等都是有限博弈。3.2 纳什均衡在博弈论发展史上,均衡的概念有着一段发展演化的经历。从早期的占优战略均衡、重复剔除劣战略的占优战略均衡,直到后来的纳什均衡,博弈论的基本框架才告完成。继纳什之后,一些更为精致的均衡概念也被陆续提出,而且,这方面的研究还在不断深入。但是,纳什均衡概念无疑在博弈论发展史上占据有里程碑式的地位,它的提出标志着博弈论进入了一个有着完整方法论体系的新兴学科的迅猛发展时期。在介绍纳什均衡概念以前,我们先来回顾一下有关占优战略均衡和重复剔除劣战略

15、的占优战略均衡的相关概念和理论。3.2.1 占优战略均衡所谓占优战略均衡,是指当所有局中人都选择各自的占优战略时所出现的战略组合。为了表达上的简略,我们今后可将除第i个局中人所选择战略s,S,之外的其他所有局中人所选择的战略组合向量记为s_=(s;,A,S-,SA,S4),s,S,iT,又记s=(si,As-,s;,SA,S4)=(ss_)o定义3.2设s,S7S,若满足I4,(jl,5JW.(s,X3巾,I)其中DM表示SA,SSS,构成的欧几里德乘积空间。则称X为。的劣战略,称s,为s,的占优战略。当不等式(3.1)对某些S变成等式时,称s,为&的弱劣战略,称s,轴;的弱占如战略)VL11

16、5当木嚏式(3.1)对任何s_,都是严格不等式时,即不等式2)成立。(3.2)则称S;为S;的严格或强劣战略,称S,为S,的严格或弱占优战略。显然,S;为&的占优战略就是在无论其他局中人选择什么战略情形下,局中人i选S;都是相对于他选S,为最优的战略。譬如,在前述给出的“囚徒困境”模型中,对于任一犯罪嫌疑人,无论另一犯罪嫌疑人是选择“坦白”或是选择“抵赖”,他选择“坦白”都是相对于选“抵赖”为最优的战略。因此,“坦白”是“抵赖”的占优战略,而“抵赖”是“坦白”的劣战略,并且,“坦白”还是“抵赖”的强占优战略,“抵赖”是“坦白”的强劣战略。定义3.3卷;是所有S,中其他战快的占优战略,则极为局中

17、人i的占优战略,其中s,sS,ieF0即是说当且仅当WSFT)满足不等式3)时,s;是i的占优战略。U,(s,s2)0,(s,sJ(3.3)j,eS1.s.le11SijeF当不等式(3.3)在某些S处变为等式时,称s,为i的弱占优战略;当不等式(3.3)对任何Je口3都是严格不等式时,称s,为严格或强占优战略。但是,在博弈论中,我们通常所说的(弱)劣战略并不是指(弱)劣于任何其他战略的战略,只要某个战略(弱)劣于另一战略,我们就可称其为(弱)劣战略。对于某局中人来说,假如存在某个强占优战略可选择,那么,我们就没有理由相信他会不选择这个战略。如果所有局中人都选择了各自的强占优战略。那么,我们可

18、预测没有任何人可能改变已有的战略选择。从另一方面看,如果在一个博弈中,每一个局中人都存在一个强占优战略(显然,此时这种强占优战略必然是唯一的),我们可预测每一个局中人都会选择其各自的强占优战略。所以,我们就自然将这种可能出现的均衡状态当作一种可预测结果。于是,我们有如下定义:定义3.4当一个博弈中的所有局中人都选择各自的强占优战略时,我们称博弈达到了占优战略均衡。当所有局中人都选择了各自的强占优战略时,根据理性人假定,我们可预测任何一个局中人都不会改变其己有的战略选择,因而这种已有的战略组合是一种均衡。需要指出,当我们把定义3.4中的“强占优战略”改为“占优战略”时,也会得到一种类似的均衡概念

19、在一些教科书中(譬如,张维迎1996,P59),也将这种均衡称为“占优战略均衡”。但是,对于弱占优战略,我们不能预测局中人一定会选择它,因为还至少存在另一种可选择的战略,它给局中人带来的支付在其他局中人选择某些特定的战略组合时与该战略带来的支付相等。这样,我们不能预测博弈的最终战略组合选择是什么。或者说,在这种场合,可能出现的博弈结局有多种可能,因而存在多个不同的“占优战略均衡”。为了避免这种不确定性,博弈论中通常将“占优战略均衡”按定义3.4的方式给出其定义,即只考虑由强占优战略组合构成的“占优战略均衡”。我们在本书中也沿此惯例,在谈到“占优战略均衡”时,指的是按定义3.4给出的概念。例3

20、1当我们在定义3.4中用“占优战略”取代“强占优战略”时,就可能存在多个“占优战略均衡”。表3.3中给出了一个例子。表3.3存在四个“占优战略均衡”的博弈BMR1,12,03,10,21,12,21,32,23,3当在定义3.4中用“占优战略”取代“强占优战略”时,A有两个占优战略,即战略a和战略c;B也有两个占优战略,即战略L和战略R;但a、C只是A的弱占优战略;L、R只是B的弱占优战略。显然,(c,L)、(c,R)、(a,L)和(a,R)都是在这种意义下的“占优战略均衡”。我们在前章中给出的“囚徒困境”博弈就存在“占优战略均衡”,由于该博弈中每个局中人都有强占优战略“坦白”,所以,该博弈

21、存在唯一的“占优战略均衡”即(坦白,坦白)。3.2.2 重复剔除严格劣战略的占优战略均衡尽管严格占优战略均衡或许是博弈模型能给出的一种很好的博弈结局预测,但存在严格占优战略均衡的博弈模型并不多见(存在占优战略均衡的博弈模型也很少),也就是说,运用严格占优战略均衡(甚至占优战略均衡)对博弈行为进行预测是不具普遍功用的,因为在许多博弈中,并不存在严格占优战略均衡(甚至占优战略均衡)。然而,严格占优的概念对于寻找许多博弈模型的均衡解仍然具有启发性。如果我们将对“严格占优战略”的要求放松至“相对严格占优战略”,即不要求某战略比其他所有战略都严格为优,仅要求某战略只比另一战略严格为优,此时,我们有理由预

22、测局中人不会选择另一战略(即劣战略),从而将其从博弈模型中剔除并得到一个新的博弈模型。假设其他局中人知道该局中人剔除了另一战略,而该局中人也知道其他局中人知道该局中人剔除了另一战略,博弈就在一个新的战略空间组合条件下进行。这种过程可以重复性地不断进行,因为剔除了某个劣战略的新博弈模型仍然可能含有新的属于其他局中人的劣战略,从而循着同样的方法将其剔除。当这种重复剔除劣战略的过程进行到最后时,倘若博弈模型只剩下唯一的一个战略组合,那么,可以预言这个战略组合是一种均衡,我们称其为“重复剔除劣战略的严格占优战略均衡”(iterateddominanceequilibrium),简称为“重复剔除的占优战

23、略均衡”。定义3.5战略组合s4=(S,A,S4)称为重复剔除劣战略的严格占优战略均衡,如果它是重复剔除严格劣战略后剩下的唯一的战略组合。当这种唯的战略组合存在时,我们称该博弈是重复剔除占优可解的(dominancesolvable)。例3.2智猪博弈在一个猪圈里养着一头大猪和一头小猪,在猪圈的一端放有一个猪食槽,在另一端安装有一个按钮,它控制着猪食的供应量。假定:按一下按钮,就有8单位猪食进槽,但按动按钮需支出2单位成本;若大猪先到食槽,则大猪吃到7单位食物,而小猪仅能吃到1单位食物;若小猪先到,则大猪和小猪各吃到4单位食物;若两猪同时到,则大猪吃到5单位,小猪仅吃到3单位。这里,每头猪都有

24、两个战略:按或等待。见表3.4给出的战略式表述。3,12,47,-10,0按大猪蠢表3.4智猪博弈小猪按等待显然,该博弈不存在占优战略均衡,因为尽管小猪有一个严格占优战略,但大猪并没有占优战略,所以,不能运用占优战略均衡概念求解此博弈;但我们却可用“重复剔除劣战略”的方法找出“重复剔除劣战略的占优战略均衡”解。假定:小猪是理性的,因而她会选择严格占优战略“等待”,从而她会将劣战略“按”剔除。假定大猪正确地预测到小猪会剔除“按”并选择“等待”,故而博弈就变成了表3.5给出的情形。表3.5剔除劣战略后的智猪博弈小猪等待大猪按2,4等待0,0显然,在新的博弈中,大猪有一个严格占优战略“按”,而此时“

25、等待”仍是小猪的严格占优战略(小猪此时只有一种战略“等待”),假定大猪也是理性的(因而才被称为“智猪”),则大猪不会选择“等待”。因此,在这个新的博弈中,存在严格占优战略均衡(按,等待),即大猪选择“按”,小猪选择“等待”。例3.3见表3.6给出的战略式博弈表3.6一个战略式博弈的重复剔除劣战略过程UDLO1,20,30,1BLMBMR1,01,20,10,30,12,0(a)(b)B1.M1,01,2(C)该博弈不存在占优战略均衡,但局中人B有一个严格劣战略R,因为战略M严格优于战略R。假定B是理性的,则B将剔除战略R;假定A知道B是理性的,因而A预测B会剔除R,从而博弈变成表中(b)的情形

26、此时,A有严格占优战略U,假定A是理性的,他将剔除严格劣战略D,从而博弈变成了表中的情形(0;假定B知道A是理性的,并且B知道A知道B是理性的,从而B知道博弈变成了情形(C)中;此时,理性人B将选择M,因而得到重复剔除劣战略的严格占优战略均衡(U,M)0在一个具体的博弈中,劣战略可能不是唯一的,即可能存在多个战略相对于其他战略来说是劣战略,此时,一个可能被提出的问题是:剔除劣战略的顺序(包括对同一局中人战略空间中的不同劣战略剔除顺序和不同局中人战略空间中劣战略剔除顺序)是否会影响到最后获得的均衡?不同的剔除劣战略顺序是否会给出不同的均衡?答案是这样的:对于有限博弈,倘若每一次剔除的是严格劣战

27、略,则均衡与剔除的顺序无关;但对于无限博弈,剔除同一局中人的劣战略顺序可能与均衡有关,但在特定剔除方法假定下(指将同一局中人的所有劣战略一次性剔除的方法)均衡与不同局中人劣战略剔除顺序无关(见定理3.1推论3.1.1和注1、2)o于是我们有定理3.1。定理3.1(蒲勇健,2001)如果每一次剔除将同一局中人的所有劣战略剔除掉,则一个战略式表述博弈在经过重复剔除(严格)劣战略后剩下的博弈与剔除的(局中人)顺序无关。证明:设博弈的战略式表述为G=Sj,ASu,A,u,我们只需证明经过剔除(严格)劣战略后剩下的博弈中各个局中人的战略空间与剔除的(局中人)顺序无关即可。设A,是由局中人i的所有劣战略构

28、成的集合。令S,(O)=S;,i=l,A,n。S,(1)是S,中剔除所有i的劣战略后余下的集合,即S,(1)三SA,(1),i=l,A,n作新的战略式博弈G(1)=S1(I),A,S,(l)1,A,u,(不妨设G(O)=G);再设A,是G(I)中由局中人i的所有劣战略构成的集合,令S,=S,(I)A,,i=l,A,n作新的战略式博弈6(2)二岔,(2)八5,(2);如人,11,);一般地,设A(m)为博弈G(m-l)=S(ml),A,S,(ml);u,A,u,中由局中人i的所有劣战略构成的集合。令S,(m)=S,(m-l)A,(m),i=l,A,n。G(m)=Si(m-l),A,S,(m)w,

29、A,U显然有S,(m)cS,(m-1),i=l,A,n;令SJ.Sjm,i=l,A,11arf今设有某一剔除过程,其中第m次剔除是对某个局中人的原战略空间中的劣战略进行的,而剔除后由该局中人原战略空间中余下的战略所构成的集合为B。(11f1,A)o在这里,我们还需对剔除的方式作出一个特别的规定(尽管这种规定是特别的,但却是一种十分合理的假设),即假设每一次剔除都是同时将被剔除劣战略所属战略空间中所有的劣战略一并全部剔除L记该博弈经劣战略剔除后所得到的博弈为5虻(SASu,o)o我们将证明S*=S。(即$=s,i=lAn),由于”是按任意(在上述规定的意义上)顺序剔除劣战略后所得到的博弈,故由此

30、可证明定理为真。我们先证明有5。0$*,即S;CSj=I,A,n,使用数学归纳法:显然,对于B,必存在某个i使得Bl=S,(1),设第二次进行劣战略剔除的战略空间为S,显然有B?S,而a9S,为第二次剔除劣战略过程中被剔除的任一战略。我们在下面的证明过程中将不断重复使用这样种逻辑,即当其他局中人的战略空间中的某些战略被剔除后,给定一个局中人的某个战略若在其他局中人的原有战略空间条件下是劣战略,则该战略在其他局中人的战略空间中的某些战略被剔除之后仍是劣战略,也就是说当其他局中人在较大的战略空间中选择战略时,&为劣战略意味着当!也局中人在较小战略空间中选择战略时a,仍为劣战略。我们称该逻辑为SSC

31、法则(StmtegySpaceContraCtLaW,战略空间收缩法则)。所以,a,S,(2),故B2S,(2)下面作归纳法假设:设当m21时有BSjCnl)(m)其中j(k)如此定义,即第k次进行劣战略剔除是对局中人j(k)的战略空间中的劣战略进行的剔除,k=lAo我们往证Bw+S;(m+i)(m+l)设某&(mI)S为第11M次剔除劣战略中被剔除的任一战略,据归纳法假设和基于SSC法则有a(m+D)Sj(mn(m+1)于是有BmS;(m(m+l)o对于任意的i=lA,n,存在一个唯一的自然数序列集H,=h使得BCS,且BCB当且仅当hh2,h,h2eH也就是说,第h;次剔除劣战略是在局中人

32、i的战略空间中完成的。因前已证BSya)(h)=S,(h),h,eH2故IBMnTSM)WIS,(e)uIS,(r)W14D1S.(m)=5;矩那跪文建Fl-n故$3S,i=l,A,11即S*S下面我们再证明反过来也有S;若s;。显然,按照我们规定的剔除方式,B1=S(1),B2=S2XI),有可能某些S,(k)在G(k)中没有劣战略,k=O,l,A,因而对任何B,都有BmS,(k),m=lo但为了以下数学讨论上的方便,我们可根据需要在(B。中添加某些B,使B,S,(k),k=O,lA但实际上对应于这些B,的剔除并没有发生。显然,经过这样调整后的剔除实际上将与调整前的剔除过程具有同样的剔除结果

33、这样,我们不妨假设所讨论的闹已经经如此调整。按此规定,我们可定义第h次剔除是第一次对局中人i的战略空间中的劣战略进行剔除,据SSC法则有B=S9(I)(3.4)设H(I)=maxh4,i=l,A,n于是BmSmi),当mH定义H(2)=max%,h=l,A,n,其中h2的定义为:第h2次剔除是第H(I)次剔除后第一次对局中人i的战略空间中的劣战略进行的剔除(若原来的伯。中没有这种剔除我们在这里不妨按前述思路在B中添加一次对S;中的劣战略“剔除”,但实际上并未发生真实的“剔除”)。由式(3.4)和SSC法则,有BCS,(2),i=IAn下面,我们用归纳法证明一般有BS(m),i=1,A,n,m

34、1,A(3.5)其中h是如此定义的:第h次剔除是在第H(m-1)次剔除后第一次对局中人i的战略空间中的劣战略进行的剔除(若原来的B。中没有这种剔除,我们在这里桢按前述思路在Bm中添加一次棉,中的劣战略“剔除”,但实际上并未发生真实的“剔除”),而H(ml)的定义用归纳法定义。已定义了m=2,3时的H(ml),假定H(m2)已有定义,则H(m-l)=maxhm-,i=1,A,n其中,h的定义为:第h次剔除是在第H(m2)次剔除后第一次对局中人i的战略空间中的劣战略进行的剔除(若原来的Bm中没有这种剔除,我们按前述方式不妨在Bm中添加一次对S;中劣战略的“剔除”)。令H(m)=maxhm,i=1

35、A,n其中h的定义为:第h,次剔除是在第H(m-1)次剔除后第一次对局中人i的战略空间中的劣战略进行的剔除(若原来的Bn中没有这种剔除,我们按前述方式不妨在Bm中添加一次对S,中劣战略的“剔除”)。再令H(m+1)=maxh,i=IAn其中h的定义为:第h次剔除是在第H(m)次剔除后第一次对局中人i的战略空间中的劣战略进行的剔除(若原来的B,中没有这种剔除,我们按前述方式不妨在Bm中添加一次对S,中劣战略的“剔除”)。据式5)和SSC法则,有BS(m+),i=l,A,n按我们的前述假设,对任何m=l,A,h都存在,且BB和hh,m=l.A任给qcI%,对任意的BzWS,必有某BB1,只要hm

36、h,故三三la,B,所以S;反之,任给出S,必有B2,m=l,AJr,JBJ1BLr由式(3.5)还有I%UlS,(m)=S/谓以得到&:uS:,i=LA,n即S*cs因而得到S*=s证毕!推论3.Ll若博弈是重复剔除占优可解的,则重复剔除的占优战略均衡与剔除劣战略的(局中人)顺序无关。证明:当博弈是重复剔除占优可解的,则S;都是单一元素集合,即S;中只有一个元素aj=lA,n,均衡为S*=(j,A,a),据定理3.1知5*与剔除(局中人)顺序无关。证毕。在定理3.1和推论3.11中,我们都假定了剔除的是严格劣战略。一个十分自然的问题是,倘若被剔除的包括有非严格劣战略,剔除的顺序与均衡结果有关

37、吗?答案是肯定的。当被剔除的战略中含有非严格劣战略时,剔除顺序不同则剩下的博弈是不同的,当剩下的博弈恰好就是均衡战略组合时,剔除的顺序不同则剩下的博弈均衡也可能不同。在表3.7中,我们给出这样一个例子。表区7剔除非严格劣战略将导致均衡结果与剔除顺序有关的例子1.MR1,3212,30,30,10,20,20,10,4当我们以顺序D、R、M、H剔除时,均衡为(U,L);但若剔除顺序改为M、H、L、D,则均衡为(U,R)3当我们通过剔除严格劣战略方式对表3.7中的战略式博弈进行重复剔除劣战略,将发现它不是重复剔除占优可解的。3.2.3关于重复剔除的占优战略均衡的几点评论尽管重复剔除劣战略方法在求解

38、博弈模型均衡解上比起占优战略均衡方法前进了一步,但这种方法仍然存在严重不足。除了许多博弈模型不是重复剔除占优可解,从而这种方法不具普遍适用性外,一个致命的缺陷是这种方法对局中人过高的理性要求实际上超出了现实中大多数自然人的真实理性程度。譬如,在例3.3中,我们要通过重复剔除劣战略方法得到均衡(U,M),就需要假定不仅A和B都是理性的,而且还要假定A知道B是理性的,还要假定B知道A是理性的并且B知道A知道B是理性的。一般地,A是理性的和IB是理性的并不意味着A知道B是理性的和B知道A是理性的,更不意味着B知道A知道B是理性的和A知道B知道A是理性的。因此,假定A知道B是理性的实际上对A的理性程度

39、作了比A是理性的和B是理性的假定更高的理性程度假设;假定A知道B知道A是理性的又更进一步对A的理性程度作了更高的假设。显然,当博弈中的局中人战略空间增大时,剔除劣战略的次数会增加,为了得出重复剔除占优均衡,就需要对局中人的理性程度作出更高的假设,如假定A是理性的、B是理性的、A知道B是理性的、B知道A是理性的、A知道B知道A是理性的、B知道A知道B是理性的、A知道B知道A知道B知道A是理性的等等。在一般的博弈场合,我们若对所有局中人的理性程度作出最高程度的假设,即假设所有局中人是理性的、所有局中人知道所有局中人是理性的、所有局中人知道所有局中人知道所有局中人是理性的,则这种假设在博弈论中被称为

40、理性是局中人的共同知识(CommOnknowledge)”假设。在博弈论中,许多模型在“理性是局中人的共同知识”假定下可轻易地求得均衡解,但是,模型解往往与现实中的真实博弈结果大相径庭。造成这种矛盾的原因是多方面的,但“理性是局中人的共同知识”假定对局中人理性程度作出过高假设也许是主要的原因。譬如,在中国古典名著三国演义中,曹操在赤壁大战后败走华容道。当时,曹操败军在踏上华容道之前曾面临两条撤退道路可选择,一是华容道,另外还有一条小路可逃。孔明事先令关羽率精兵在华容道上设下埋伏,等待曹军败走此路时活捉曹操。被誉为旷世奇才的孔明军师令关羽在华容道上点燃草堆发出缕缕白烟。当曹操败至分叉路口时,前

41、兵来报:前有两条路可走,但华容道上有缕缕轻烟浮动,料有伏兵。众将闻此言,皆云选另一条道避开华容道逃命。曹操催马来到队前,举手加额,燎望远处华容道上的轻烟,思想良久,踌躇几分,忽转过身来面向众将抚掌大笑,遂令大军奔华容道而去。众将皆莫名其妙,皆云:“烽烟起处,必有军马,何故反走这条路?”操曰:“岂不闻兵书有云:虚则实之,实则虚之。孔明多谋,以为我看见烟火就会避开华容道走另一条路,而他却正好派兵在此道上等着我,我才不上他的当呢!”于是,曹操令大军沿华容道前进,但行进不久就望见关羽横刀勒马于华容道上40显然,曹操在理性程度上与孔明相比是稍逊一筹的。孔明和曹操都是理性的,孔明知道曹操是理性的,曹操也知

42、道孔明是理性的(故他知道:“孔明多谋”)。因此,孔明知道曹操看见华容道上的烟火后会走另一条路,曹操知道孔明的诡计,因此猜想孔明会在此路上设伏兵,故而曹操以为识破了孔明计谋而令大军直奔华容道;但孔明知道曹操知道孔明知道曹操看见华容道上的烟火后会走另一条路,故孔明知道曹操会如此所想而直冲华容道来,所以孔明令关羽在华容道上等着曹操,结果将曹操逮个正着。15这个故事的真实性令人怀疑,因为倘若曹操也知道孔明知道曹操知道孔明知道曹操看见华容道上的烟火后会走另一条路,则曹操会避开华容道而走上另一条路;但故事到此还未说完,如果孔明又知道曹操也知道孔明知道曹操知道孔明知道曹操看见华容道上的烟火后会走另一条路,则

43、孔明又会令关羽在另一条道上堵截曹操而不是伏兵于华容道,而这又正好将曹操逮个正着。但故事仍未完结,如果,我们可以想象,这种对孔明和普操理性程度的假设可以无限增高下去,而结果并不能明确告诉我们到底关羽能否逮住曹操。我们将在后面引入了混合战略博弈后,再来重新将这个故事表述为博弈问题,并证明只要我们不假定孔明在理性程度上高出曹操一筹,则孔明不一定能令关羽活捉住曹操,还要证明当我们假设孔明和曹操在理性程度上不分伯仲时(假设他俩的理性程度相同),则曹操有一半的机会逃脱。在中国古典文献中,我们还可以找到另一个类型的例子。据韩非子所述,战国时孙武的后代孙膑因受同窗庞娟的迫害致残而远走他乡,最后流落在齐国名将田

44、忌帐下作谋士。一日孙膑见田忌闷闷不乐,便问田忌有何不快之事。田忌告诉孙膑,近来齐威王(齐国国王)常要他与其赛马,赛马规则是每次双方各出三匹马,一对一比赛三场,每一场的输方要赔一千斤铜给赢方。齐威王的三匹马和田忌的三匹马按实力都可分为上、中、下三等,而齐威王的上、中、下三匹马都分别比田忌的上、中、下三匹马略胜一筹,因此田忌每次都是连输三场,要输掉三千斤铜。孙膑闻得此事,心中筹划如何为田忌献计赢得赛马。结果,经调查研究发现,田忌的上马虽不如齐威王的上马,却要比齐威王的中马和下马都要好,同样,田忌的中马则比齐威王的下马要好一些。于是,孙膑为田忌出奇计:先用田忌的下马对抗齐威王的上马,再用田忌的上马对

45、抗齐威王的中马,最后才用田忌的中马对抗齐威王的下马。这样,田忌可以输掉第一场作为代价而赢得后二场比赛,每次比赛可净赢齐威王一千斤铜。这个故事告诉我们在实际生活中有可能处于绝对劣势的一方依靠计谋仍可战胜强者。但是,在这个故事中,我们实际上假设了齐威王是“傻子”齐威王凭什么要用自己的上马对田忌的下马呢!当田忌出下马时,齐威王完全可以出下马取胜,当田忌出上马时,齐威王出上马可胜,当田忌出中马时,齐威王可出中马胜之;但反过来,当齐威王出下马时,田忌又可换出中马取胜,当齐威王出上马时,田忌可出下马输一场,然后当齐威王出中马时,田忌再出上马赢得最后一场,从而净赢一场;但又反过来,若田忌开始换出中马,齐威王

46、则可换出中马,。我们看到,这个游戏完全类似于前面提到的三国演义中华容道上的关羽与曹操的故事。在开始,田忌是“傻子”,他的理性程度稍逊于齐威王,故而傻乎乎地用自己的上马对齐威王的上马,用自己的中马对齐威王的中马、用自己的下马对齐威王的下马。然后,经孙膑点拨后,田忌的理性程度提高了,但这时齐威王又成了“傻子”,其理性程度反过来逊于田忌(和孙膑),因为他居然在拥有绝对优势条件下输掉一千斤铜他居然愚蠢地用自己的上马对田忌的下马、用自己的中马对田忌的上马、用自己的下马对田忌的中马。如果这两个历史故事是曾经真实发生过的,那么,现实中的博弈者或许并不满足重复剔除劣战略中所假定的理性条件,理性也更不是局中人的

47、共同知识。譬如,曹操在华容道上被关羽捉住,就是因为曹操的理性程度与孔明相比略低一个层次,因为尽管曹操知道孔明是理性的,故曹操以为孔明通过令关羽在华容道上施放烟火来诱骗其上当走上另一条路而此路上正好设有伏兵,所以曹操径直踏上华容道;但是,孔明不仅知道曹操是理性的,而且还知道曹操知道孔明是理性的,故而令关羽在华容道上等着曹操,结果将曹操逮个正着。在“田忌赛马”故事中,开始田忌居然不是理性的;因为在给定齐威王的出马顺序下他未能最优地设计自己的出马顺序(给定齐威王的出马顺序为上、中、下,田忌的最优出马顺序为下、上、中,但田忌居然按上、中、下顺序派出赛马)。反过来,给定田忌的出马顺序为上、中、下,齐威王按上、中、下出马是最优的,所以齐威王是理性的。尽管如此,博弈论并不假设不同的局中人具有不同的理性程度,当我们假定曹操比孔明“傻”或齐威王比孙膑和田忌“蠢”时,曹操被孔明智胜或齐威王输给孙膑与田忌是理所当然的。博弈论要研究的是在局中人的理性程度完全相同的条件下,局中人如何在战略选择下达到某种均衡。我们将在后面证明,当假定

宁ICP备18001539号-1