第八章博弈论续ppt课件.ppt

资源描述

《第八章博弈论续ppt课件.ppt》由会员分享，可在线阅读，更多相关《第八章博弈论续ppt课件.ppt（73页珍藏版）》请在三一文库上搜索。

1、（一）不完全信息博弈前面的分析都假定支付函数是所有参与人的共同知识。满足该假设的博弈称为“完全信息博弈”。虽然它在许多情况下是一个较好的近似，但现实中很多博弈并不满足上述假设。如当你与一个陌生人打交道时，你并不知道他的特征是什么（事实上，即使是与你长期共事的人也是如此）；当你购买（卖）一件名画或古董时，你并不知道卖主愿意脱手的最低价格（或买主愿意的最高出价是多少）；当一个企业进入市场时，它也不知道市场上的在位企业的成本函数是什么，等等。,不完全信息静态博弈,事实上，限于人的精力和智力，参与人对有关信息的了解是不完全的，仅为有限理性；同时，信息资源是稀缺的，获取完全信息的成本也过高。因此，信息

2、不完全是现实的常态。,面对不完全信息，人们可以对不确定性做出主观推测和判断，并据此进行博弈，以实现预期收益最大化。这就是说，局中人虽然不确切知道对手的策略选择及其收益函数，却知道其可性的大小概率分布。通过引入概率分布，便将原来的不完全信息博弈转为完全但不完美信息博弈（complete but imperfect information game），可以通过求解后者得到原博弈的均衡解，又称贝叶斯均衡（Bayesian equilibrium）。,完全信息与完美信息,如果收益函数为参与人的公共信息，是完全信息。如囚犯困境中的收益巨阵：A知道，B也知道；A知道B知道，B也知道A知道；A知道B知道A知

3、道， B也知道 A知道 B知道；如果不仅收益函数是公共信息，而且后行动者能够观察到先行动者此前的全部策略行为，即博弈的进程也成为公共信息，就是完美信息。,贝叶斯纳什均衡是指：在给定参与人类型和其他参与人类型的先验概率分布的条件下，所有参与人都达到预期收益最大化。贝叶斯纳什均衡是纳什均衡在不完全信息条件下的扩展，它与完全信息静态博弈的纳什均衡一样，都是给定其他参与人策略时最优反应策略的组合，将收益为预期收益。,例：市场进入博弈潜在进入企业（参与人1）决定是否进入一个新的产业，但不知道在位企业（参与人2）的成本函数，不知道它选择默许还是斗争。设在位者有两种可能的成本函数：高成本或低成本；对应两

4、种成本状况的不同策略组合及支付矩阵如下表：表1,进入者有关在位者的成本信息是不完全的，但在位者知道进入者的成本函数。在完全信息下，若在位者是高成本，进入者的最优选择是进入；若在位者是低成本，进入者的最优选择是不进入。但进入者并不知道在位者是高成本还是低成本，故进入者的最优选择依赖于他在多在程度上认为在位者是高成本的或低成本的。假定进入者认为在位者是高成本的概率为p，低成本的概率为(1-p)。则进入者选进入的期望利润是p(40)+(1-p)(-10)，选不进入的期望利润为0。因此，进入者的最优选择是：若，进入；若，不进入（当时，进入者进入与不进入无差异，可假定它进入）。,例：生活中

5、的求爱博弈设想有人向你求爱，你的选择接受还是拒绝依赖于你对求爱者品德的判断。假设你准确地知道求爱者品德良好，你会选择接受，反之，拒绝。但你并不能准确地知道求爱者的品德。此时，你的决策显然取决于你在多在程度上相信他是一个品德优良（品德恶劣）的人。下表列出了两种情况下的支付矩阵。假定不论求爱者品德如何，只要他求爱你接受，他就得到100；但你的支付依赖于求爱者的类型：接受一个品德优良的求爱者使你得到100，而接受一个品德恶劣者的求爱使你损失100。求爱者（不论何种类型）在你拒绝时损失50，因为他会丢面子。,求爱者博弈：品德优良者求爱,求爱者博弈：品德恶劣者求爱,现在假设你认为求爱者品德优良的概率为

6、。求爱者也知道这个为多少，则他求爱你接受时你的期望效用为，你不接受时你的期望效用为零。当时，你接受才是最优选择。若确实大于1/2，贝叶斯（纳什）均衡是：求爱者求爱，你接受；反之，如果，贝叶斯均衡是：求爱者不求爱，你不接受。此时求爱者选择不求爱的原因是，他知道他求爱会被拒绝，这种有损颜面的事不值得干。,（二）海萨尼（Harsanyi）转换一般地，如果在位者有T种可能的不同成本函数，进入者似乎是在与T个不同的在位者博弈。海萨尼（1967-1968）提出了一个处理不完全信息博弈的方法：引入一个虚拟的参与人“自然”；自然首先行动决定参与人的特征（如成本函数），参与人知道自己的特征，但其

7、他参与人不知道。这样，上述不完全信息博弈就转换成完全但不完美信息博弈（方括号内的数字代表自然选择不同行动的概率）（如下图），可用标准的分析技术进行分析，这就是“海萨尼转换”。,1、引入一个虚拟局中人自然N（nature），自然没有自己的得失，惟一的作用是赋予局中人的类型t=t1，t2，tn，ti Ti（i=1，2，n），且仅将局中人i的类型告诉他自己，不让其他局中人知道； 2、局中人i在给定自己类型ti的条件下，对其他局中人可能类型t i主观判断P；,3、局中人i的策略空间Si取决于他的类型，即Si=Si（ti）； 4、所有局中人同时行动，局中人i从自己的策略空间Si选择策略si，或者说，从自

8、己的行动空间Ai中选择行动ai； 5、局中人i的收益取决于他的类型和所有局中人的行动选择即 Ui=Ui（a1，a2，an；ti）。 G=T1, T2，Tn；S1，S2，Sn；P1，P2，Pn；U1，U2，Un；,上例中，假定自然选择的只是在位者是高成本还是低成本。更一般地，自然在博弈的开始选择的包括参与人的策略空间、信息集、支付函数等。将参与人所拥有的个人信息称为他的类型。,据此，可允许一个参与人不知道其他参与人是否知道自己的类型，如在市场进入博弈中，在位者不知道进入者是否知道自己是高成本还是低成本，只知道进入者有p的概率知道自己的成本函数，(1- p)的概率不知道自己的成本函数。此时，说进

9、入者也有两种类型：知道（在位者的成本）或不知道（在位者的成本）。由于在大多数博弈中，参与人的特征由支付函数完全决定，一般将参与人的支付函数等同于他的类型。,（二）、贝叶斯均衡的应用举例,例：不完全信息古诺模型在不完全信息古诺模型里，参与人的类型是成本函数。设反需求函数为，每个企业都有不变的单位成本。令为企业i的单位成本，则它的利润函数为：假定企业1的单位成本是共同知识；企业2的单位成本是或，且企业2知道自己的成本，但企业1只知道的可能性为，的可能性为，是共同知识。,企业1不知道企业2的真实成本从而不知道企业2的最优反应是还是，因此，企业1将选择最大下列期望利润函

10、数：,解最优化的一阶条件可得企业1的反应函数：,均衡意味着两个反应函数同时成立。解两个反应函数可得贝叶斯均衡：,比较不完全信息下的贝叶斯均衡与完全信息下的纳什均衡。若企业2的成本是，企业1知道它，则反应函数分别为：,即是说，与完全信息相比，在不完全信息下，低成本企业的产量相对较低，高成本企业的产量相对较高。原因是，当企业1不知道时，只能生产预期的最优产量，高于完全信息下面对低成本竞争对手时的产量，低于完全信息下面对高成本竞争对手时的产量；企业2对此作出反应。下图是两种均衡比较的直观显示。,Qa,Qb,120,60,120,60,40,40,Qa=60-Qb/2,Qb=60-Qa/2,古诺均

11、衡点(纳什均衡）,斯塔克伯格（精炼）,一、精炼贝叶斯均衡的基本思路在不完全信息动态博弈中，“自然”先选择参与人的类型（参与人自己知道，其他人不知道）参与人开始行动，后行动者能观测到先行动者的行动，但不能观测到其类型。由于行动是类型依存的，后行动者可通过观察先行动者选择的行动来推断其特征或修正对其类型的先验信念（概率分布），然后选择自己的最优行动。先行动者预测到自己的行动将被后行动者所利用，就会设法传递对自己最有利的信息。因此，博弈过程不仅是参与人选择行动的过程，而且是参与人不断修正信念的过程。,5.不完全信息动态博弈,精炼贝叶斯均衡是不完人信息动态博弈的基本均衡概念。它是泽尔腾的完全信息动

12、态博弈的子博弈精炼均衡与海萨尼的不完全信息静态博弈贝叶斯均衡的结合。它要求：给定有关其他参与人类型的信念，参与人的策略在每一个信息集开始的“后续博弈”上构成贝叶斯均衡；且在所有可能的情况下，参与人使用贝叶斯法则修正有关其他参与人类型的信念。例：市场进入假定有两个时期，t=1,2。在t=1期，市场上有一个垄断企业（在位者），一个潜在的进入者。若进入者进入，在t=2，两个企业进行古诺博弈，否则，在位者仍是一个垄断者。假定在位者有高成本和,低成本两个类型，进入者在开始时只知道在位者是高成本的概率是，低成本的概率为1-。这是进入者的先验信念（概率）。进入者只有一个类型，其进入成本为2；若进入，其成

13、本函数与高成本的在位者相同。在t=1，在位者要决定该时期的价格（或产量），设有三种可能的价格选择：p=4，p=5或p=6。若在位者是高成本，对应三种价格选择的利润分别是：2、6或7；若在位者是低成本，对应利润分别为6、9或8。这样，高成本和低成本在位者的单阶段最优垄断价格分别是p=6和p=5。在t=2，若进入者已进入，若在位者是高成本，两者成本函数相同，对称的古诺均衡产量下的价格是p=5，,每个企业的利润为3，进入者的净利润为1；若在位者是低成本，两企业成本函数不同，非对称古诺均衡产量下的价格是p=4，在位者的利润为5，进入者的利润为1，净利润为-1。若进入者不进入，在t=2时的在位者仍是一个

14、垄断者，不同价格选择下的利润与第一阶段相同。构造上述数字使得在完全信息下，若在位者是高成本，进入者选择进入；若在位者是低成本，进入者选择不进入。该博弈的简化扩展式表述如下表。在位者有两个单结信息集，即他知道“自然”的选择（自己的类型）；进入者有三个信息集，每个信息集有两个决策结，即进入者能观测到在位者的价格选择，但不能观测到在位者的成本函数。,图中省略了第二阶段博弈的扩展式，代之以古诺均衡支付向量和垄断利润。因为在博弈进入第二阶段后，若进入者已进入，古诺均衡产量（和对应价格）是每个企业的最优选择；若进入者没有进入，单阶段垄断产量（和价格）是在位者的最优选择。博弈进入第二阶段后，企业的行动选

15、择是一个简单的静态博弈决策，但第一阶段的选择要复杂得多。进入者是否进入依赖于它对在位者成本函数的判断：给定在位者是高成本时进入的净利润为1，低成本时进入的净利润为-1，当且仅当进入者认为在位者是高成本的概率大于1/2时，进入者才会进入。与静态博弈不同的是，在观测到在,（7,0）,（7,0）,（9,0）,（9,0）,（3,1）,（7,0）,（3,1）,（7,0）,（3,1）,（7,0）,（5,-1）,（9,0）,（5,-1）,（9,0）,（5,-1）,（9,0）,不进入,进入,不进入,进入,不进入,进入者,位者第一阶段的价格选择后，进入者可修正对在位者成本函数的先验概率，因为在位者的价格选择可能

16、包含有关成本函数的信息。如低成本在位者不会选择p=6（因为他不希望进入者认为自己是高成本），故进入者观测到在位者选择了p=6，可推断在位者一定是高成本，选择进入有利可图。这样，即使是高成本在位者也可能不会选择p=6，尽管它是单阶段最优垄断价格。类似地，低成本在位者也可能不会选择p=5，如果p=5会招致进入者进入。问题的核心是在位者必须考虑价格选择的信息效应：不同的价格选择如何影响进入者的后验概率从而影响进入者的进入决策。一个非单阶段最优,价格会减少现期利润，但若它能阻止进入者进入，从而使在位者在第二阶段得到垄断利润而非古诺均衡利润，若两利润之差足够大，且在位者有足够的耐心，选择一个非单阶段最

17、优价格可能是最优的。我们将看到，在均衡状态下，在位者究竟选择何种价格，不仅与成本函数有关，而且与进入者的先验概率有关；而无论为多少，单阶段最优垄断价格不构成一个均衡。,对于上述动态博弈的均衡结果，仅使用上面的贝叶斯纳什均衡是不够的，因为在静态贝叶斯均衡中，参与人的信念是事前给定的，均衡概念没有规定参与人如何修正自己有关在位者成本函数的信念。（但是，若进入者可任意地修正该信念，上述不完全信息动态博弈可以有任意的贝叶斯均衡）。,精炼贝叶斯均衡是贝叶斯均衡、子博弈精炼均衡和贝叶斯法则的结合。它要求（1）在每个信息集上，决策者必须有一个定义在属于该信息集的所有决策结上的一个概率分布（信念）；（2）

18、给定该信息集上的概率分布和其他参与人的后续策略，参与人的行动必须是最优的；（3）每个参与人根据贝叶斯法则和均衡策略修正后验概率。,二、贝叶斯法则,一般地，在面临不确定性时，在任一时点上，我们对某事件发生的可能性有一个判断。然后根据新的信息来修正该判断。统计学上，修正之前的判断称为“先验概率”（prior probability），修正之后的判断称为“后验概率”(posterior probability )。贝叶斯法则正是人们根据新信息从先验概率得到后验概率的方法。以不完全信息博弈为例说明该法则。假定参与人的类型是独立分布的。假定参与人i有K个可能的类型，有H个可能的行动。,例：若把所有

19、的人分为好人（GP）和坏人（BP），所有的事分为好事（GT）和坏事（BT），则一个人干好事的概率=他是好人的概率p(GP)好人干好事的概率p(GT|GP)+他是坏人的概率p(BP)坏人干好事的概率p(GT|BP)： #假设观测到一个人干了一件好事，则他是好人的后验概率为：具体地，假定我们认为这个人是好人的先验概率为1/2。则在观测他干了好事之后，应如何修正他是好人的概率依赖于我们认为这件事好到什么程度。,考虑三种极端的情形。第一，这是一件非常好的好事，好人一定会干，坏人绝不可能干，即,即是说，尽管原来认为这个人是好人的可能性是1/2，但在观测到他干了这件好事后，我们会得出结论：他肯定是个好人

20、。,第二，这是一件非常一般的好事，好人会干，坏人也会干，即,即我们对他的看法不变。,第三，介于上述两者之间：这件事好人肯定会干，但坏人可能干也可能不干，概率各为1/2，则：,即我们认为他是好人的可能性增加了，但他仍有1/3的可能性是坏人。,# 假如我们观测到这个人干了一件坏事，将如何改变对他的看法？若我们相信，好人绝不会干坏事，只有坏人才会干坏事，则可肯定他绝不是一个好人：,这里p0是坏人干这件坏事的概率。或者说他肯定是一个坏人：,#若我们原来认为一个人100%的是好人，但突然发现他干了一件坏事。该如何改为对他的看法？显然有一个彻底的改变：嗨，原来他是个坏人。 #若原来认为他肯定是一个坏人，突

21、然发现他干了一件好事，该如何看待他？若我们认为坏人干好事的目的仅仅是为假装好人，若他是在知道我们认为他是坏人的情况下干了好事，则我们认为他是坏人的后验概率是0，1区间的任意数（当然，一般不会马上认为这个人一定是好人，除非这件事非常好，如若不然，坏人总是有积极性干一件好事以使我们认为他是一个好人。当然，如果认为坏人干好事并不仅仅是,为了假装好人，则对他的看法就不会改变，因为根据贝叶斯法则：,这里p0是坏人干好事的概率，q0是好人干好事的概率。,从上例中可看出，如何改变对一个人的看法不仅依赖于我们认为他是好人或坏人的先验概率，而且依赖于我们如何认为好人干好事和坏人干好事的条件概率。,（三）市场进入

22、博弈的精炼贝叶斯均衡。由于在位者有两个潜在类型，进入者只有一个类型，因此，只有进入者修正信念。令是进入者观测到在位者的价格选择后认为在位者是高成本的后验概率（注意：这里p是指价格）。先证明：不论先验概率是多少，在第一阶阶段，高成本在位者选择单阶段最优垄断价格p=6和低成本在位者选单阶段最优垄断价格p=5不是一个精炼贝叶斯均衡。如果在位者作出上述选择，进入者观测到p=6就知道在位者是高成本，即；观测到p=5就知道在位者是低成本，即。给定该后验,信念，就知道进入者将进入，当且仅当他观测到p=6。但考虑高成本在位者。若他选择p=6，第一阶段得垄断利润7，第二阶段得寡头利润3，总利润为10。

23、但若他模仿低成本企业，选p=5，第一阶段得利润6，第二阶段得利润7，总利润为13。因此， p=6不是高成本在位者的最优选择，上述策略不构成精炼贝叶斯均衡。再考虑两种不同情况下的均衡1/2和1/2.先考虑1/2。在这种情况下，精炼贝叶斯均衡是：不论高成本还是低成本，在位者选择p=5；进入者将进入，当且仅当进入者观测到p=6（基于,给定进入者的后验概率和策略，若高成本在位者选p=6，进入者进入，他获利润10；若选p=5,进入者不进入，他获利润13。故牺牲第一阶段的1单位利润换取第二阶段的4单位利润是合算的， p=5是最优的。类似地，低成本在位者选p=5时的总利润是9+9=18，大于选其他任何价格

24、时的利润，故p=5也是其最优选择。给定两类在位者都选p=5，进入者不能从观测到的价格中得到任何信息，即 =（1）/（1+1（1-）=1/2，进入者进入的期望利润为（1）+（1-）（-1）=2-10,不进入的期望利润为0,因此,不进入是最优的。,上述均衡被称为“混同均衡”(pooling equilibrium),因为两类在位者选相同的价格。,现在证明，若1/2，精炼贝叶斯均衡是：低成本者选p=4，高成本者选p=6；进入者选择不进入，若观测到p=4（基于）；选择进入，若观测到p=6或p=5(基于 ). 先考虑低成本者的策略。给定进入者的后验概率和策略，若低成本者选p=4，进入者不进入，其利润

25、是6+9=15；若选单阶段最优垄断价格p=5，进入者进入，其利润为9+5=14，故选p=4是最优的。考虑高成本者的策略。若高成本者选p=4，进入者不进入，他的利润是2+7=9;若他选单阶段垄断价格p=6，他的利润是7+3=10,故选p=6是最优的。,上述均衡称为“分离均衡”（separating equilibrium）,因为两类在位者选不同的价格，尤其是，低成本者选非单阶段最优价格p=4，高成本者选单阶段最优垄断价格p=6。因为若低成本者选单阶段垄断价格p=5，他将无法把自己与高成本者区分开，进入者将进入，但若他选p=4，高成本者不会模仿，进入者不进入，因此，低成本者愿放弃3单位的现期利润以

26、换取4单位的下期利润。高成本不选择p=4，因为他的成本太高，下阶段4单位的利润不足以弥补现期5单位的损失。该均衡中，进入者的实际进入决策与完全信息相同（在位者是高成本时进入，低成本时不进入）；不完全信息带来的后果是：低成本在位者损失18-15=3个单位的利润，可看成是他为证明自己是低成本而支付的“认证费用”。,各种均衡概念之间的关系,从某种意义上说，根据博弈条件的不但复杂化，后一种均衡都是前一种均衡在新条件下的扩展，前一种均衡只是后一种均衡在原条件下的特例，或者说，前一种均衡只是后一种均衡的子集。从各种不同的均衡概念中，可以得到一个极其重要的启示：政治领域实行垂直领导，下级必须服从上级，因此

27、，“上有决策，下有对策”是完全错误的。但是，经济领域实行横向联系，彼此平等互利，因此，“你有决策，我有对策”是理所当然的。,占优对策均衡,公共信息,重复剔除占优均衡,纯策略纳什均衡,混合纯策略纳什均衡,子博弈精练纳什均衡,贝叶斯纳什均衡,精练贝叶斯纳什均衡,1. 两家计算机厂商A和B正计划推出办公信息管理系统。两厂商可开发的管理系统有高速、高质（H）和低速、低质两种（L）。市场研究表明各厂商在不同策略下相应的利润由如下的收益矩阵给出。,练习题,（1）如果两厂商同时做出决策且使用极大化极小（低风险）策略，结果将是什么？（2）假设两厂商都试图最大化利润，且A先开始计划并实施，结果会怎样

28、？如果B先开始，结果又会如何？,2. 北方航空公司和新华航空公司分享了从北京到南方冬天度假胜地的市场。如果它们合作，各获得500000元的垄断利润，但不受限制的竞争会使每一方的利润降至60000元。如果一方在价格决策方面选择合作而另一方却选择降低价格，则合作的厂商获利将为零，竞争厂商将获利900000元。（1）将这一市场用囚徒困境的博弈加以表示。（2）解释为什么均衡结果可能是两家公司都选择竞争性策略。,3. 给定两家酿酒企业A、B的收益矩阵如下表：表中每组数字前面一个表示B企业的收益，后一个数字表示A企业的收益。（1）求出该博弈问题的均衡解，是占优策略均衡还是纳什均衡？（2）存在帕累

29、托改进吗？如果存在，在什么条件下可以实现？福利增量是多少？（3）如何改变上述A、B企业的收益才能使均衡成为纳什均衡或占优策略均衡？如何改变上述A、B企业的收益才能使该博弈不存在均衡？（北京大学2002研）,7. 假设有两个游戏者A和B，他们分别代表两家企业，生产不同的部件，但生产的部件在型号选择上有“大”、“小”之分。若一家企业选择的型号为“大”，另一家企业选择的型号为“小”，则会发生不匹配的问题。只有当两家企业选择的型号匹配时，才会有均衡。下表给出了这一合作博弈的形式。,（1）假设企业A先走一步，企业B的策略选择有多少种？写出A和B的策略组合及相应的收益矩阵。（2）在这些策略组合中，有无

30、纳什均衡？如有，哪些是？（3）将上述策略组合写成广延型（扩展型）博弈形式，并求出子博弈完美纳什均衡。,1. 两家计算机厂商A和B正计划推出办公信息管理系统。两厂商可开发的管理系统有高速、高质（H）和低速、低质两种（L）。市场研究表明各厂商在不同策略下相应的利润由如下的收益矩阵给出。,练习题,（1）如果两厂商同时做出决策且使用极大化极小（低风险）策略，结果将是什么？（2）假设两厂商都试图最大化利润，且A先开始计划并实施，结果会怎样？如果B先开始，结果又会如何？,2. 北方航空公司和新华航空公司分享了从北京到南方冬天度假胜地的市场。如果它们合作，各获得500000元的垄断利润，但不受限制的竞争

31、会使每一方的利润降至60000元。如果一方在价格决策方面选择合作而另一方却选择降低价格，则合作的厂商获利将为零，竞争厂商将获利900000元。（1）将这一市场用囚徒困境的博弈加以表示。（2）解释为什么均衡结果可能是两家公司都选择竞争性策略。,3. A、B两企业利用广告进行竞争。若A、B两企业都做广告，在未来销售中，A企业可以获得20万元利润，B企业可获得8万元利润；若A企业做广告，B企业不做广告，A企业可获得25万元利润，B企业可获得2万元利润；若A企业不做广告，B企业做广告，A企业可获得10万元利润，B企业可获得12万元利润；若A、B两企业都不做广告，A企业可获得30万元利润，B企业可获

32、得6万元利润。（1）画出A、B两企业的支付矩阵。（2）求纳什均衡。（北京大学1995年研）,4. 博弈的收益矩阵如下表：（1）如果（上，左）是占优策略均衡，则a、b、c、d、e、f、g、h之间必然满足哪些关系？（尽量把所有必要的关系式都写出来）（2）如果（上，左）是纳什均衡，则（1）中的关系式哪些必须满足？（3）如果（上，左）是占优策略均衡，那么它是否必定是纳什均衡？为什么？（4）在什么情况下，纯战略纳什均衡不存在？（北京大学2000年研）,5. 给定两家酿酒企业A、B的收益矩阵如下表：表中每组数字前面一个表示B企业的收益，后一个数字表示A企业的收益。（1）求出该博弈问题的均衡

33、解，是占优策略均衡还是纳什均衡？（2）存在帕累托改进吗？如果存在，在什么条件下可以实现？福利增量是多少？（3）如何改变上述A、B企业的收益才能使均衡成为纳什均衡或占优策略均衡？如何改变上述A、B企业的收益才能使该博弈不存在均衡？（北京大学2002研）,6.在纳税检查的博弈中，假设A为应纳税款，C为检查成本，F是偷税罚款，且CA+F；S为税务机关检查的概率，E为纳税人逃税的概率；不存在纯战略纳什均衡。（1）写出支付矩阵。（2）求混合策略纳什均衡。,7. 假设有两个游戏者A和B，他们分别代表两家企业，生产不同的部件，但生产的部件在型号选择上有“大”、“小”之分。若一家企业选择的型号为“大”

34、，另一家企业选择的型号为“小”，则会发生不匹配的问题。只有当两家企业选择的型号匹配时，才会有均衡。下表给出了这一合作博弈的形式。,（1）假设企业A先走一步，企业B的策略选择有多少种？写出A和B的策略组合及相应的收益矩阵。（2）在这些策略组合中，有无纳什均衡？如有，哪些是？（3）将上述策略组合写成广延型（扩展型）博弈形式，并求出子博弈完美纳什均衡。,4. 答：（1），，，。本题另外一个思考角度是从占优策略均衡的定义出发。对乙而言，占优策略为；而对甲而言，占优策略为。综合起来可得到所需结论。（2）纳什均衡只需满足：甲选上的策略时，，同时乙选左的策略时，。故本题中纳什均衡的条件

35、为：，。（3）占优策略均衡一定是纳什均衡，因为占优策略均衡的条件包含了纳什均衡的条件。（4）当对每一方来说，任意一种策略组合都不满足纳什均衡时，纯战略纳什均衡就不存在。,5. 答：（1）有两个纳什均衡，即（啤酒，白酒）、（白酒，啤酒），都是纳什均衡而不是占优策略均衡。（2）显然，（白酒，啤酒）是最佳均衡，此时双方均获得其最大收益。若均衡解为（啤酒，白酒），则存在帕累托改善的可能。方法是双方沟通，共同做出理性选择，也可由一方向另一方支付报酬。福利由800+900变为900+1000，增量为200。（3）如将（啤酒，白酒）支付改为（1000，1100），则（啤酒，白酒）就成为占优策略均

36、衡。比如将（啤酒，白酒）支付改为（800，500），将（白酒，啤酒）支付改为（900，500），则该博弈就不存在任何占优策略均衡或纳什均衡。,6. 答：（1）该博弈的支付矩阵如下表：（2）先分析税收检查边际：因为S为税务机关检查的概率，E为纳税人逃税的概率。给定E，税收机关选择检查与否的期望收益为：解，得：。,如果纳税人逃税概率小于E，税收机关的最优决策是不检查，否则是检查。再分析逃税边际：给定S，纳税人选择逃税与否的期望收益是：解，得：。即如果税收机关检查的概率小于S，纳税人的最优选择是逃税，否则是交税。因此，混合纳什均衡是（S，E），即税收机关以S的概率查税，而纳税人以E

37、的概率逃税。,7. 答：（1）如果企业A先走一步，则企业B的策略选择有四种：若A选择“大”，B也选择“大”；若A选择“小”，B仍然选择“大”。若A选择“大”，B也选择“大”；若A选择“小”，B也选择“小”。若A选择“大”，B选择“小”；若A选择“小”，B选择“大”。若A选择“大”，B选择“小”；若A选择“小”，B也选择“小”。根据B的策略选择，可得到一个24的标准型博弈，如下表所示：,（2）上述A和B的策略组合中有三个均衡，即X=大,（大，大）、Y=大,（大，小）和Z=小,（小，小）。而且，这三个均衡都是纳什均衡。先看X。当A选“大”时，B必定选“大”；而由于B必然选“大”，故A选“

38、大”是其最优反应。再看Y。当A选“大”时，B也选“大”；当A选“小”时，B也选“小”，结果两者仍选“大”，这是合作均衡。最后看Z。若A选“小”，则B必选“小”，与X一样，（小，小）是两者最优反应的组合，所以是纳什均衡。,（3）如果将上述策略组合写成广延型博弈形式，则如下图所示：,从上图可以看出，策略组合X=大，（大，大）不是子博弈完美纳什均衡。因为，尽管X是整个博弈的纳什均衡，也是以B1为始点的子博弈的纳什均衡，但它不是以B2为始点的子博弈的纳什均衡。策略组合Z=小，（小，小）也不是子博弈完美纳什均衡。理由是，Z是整个博弈和以B2为始点的纳什均衡，但不是以B1为始点的子博弈的纳什均衡。因而，只有Y=大，（大，小）属于子博弈完美纳什均衡，因为组合Y在上述三个子博弈中，都是纳什均衡。,

展开阅读全文