博弈论与企业策略.ppt_三一文库31doc.com

资源描述

《博弈论与企业策略.ppt》由会员分享，可在线阅读，更多相关《博弈论与企业策略.ppt（51页珍藏版）》请在三一文库上搜索。

1、第十一章博弈论与企业策略,一、博弈论概述（一）博弈论的研究对象博弈论Game Theory研究决策主体的行为发生直接相互作用时的决策，以及这种决策的均衡问题，即，当一个主体的选择受到其他主体选择的影响，而且反过来影响到其他主体选择时的决策问题和均衡问题。（二）博弈论的发展历史 1944年，冯诺依曼Von Neumann和摩根斯坦Morgenstern合作的博弈论和经济行为The Theory of Games and Economic Behaviour 一书出版，提出了预期效用理论等概念，但与现代博弈论关系不大。,1950s，合作博弈发展到鼎盛时期，包括纳什Nash和夏普里Sharp

2、ley1953 年的“讨价还价模型”，Gillies和Sharpley1953年关于合作博弈中的“核”core的概念等。同时，非合作博弈也开始创立，纳什在1950年和1951年发表了两篇关于非合作博弈的重要文章，杜克于1950年定义了“囚犯困境”prisoners dilemma，从而基本上奠定了现代非合作博弈的基础。 1960s年代后，泽尔滕R.Selten把纳什均衡的概念引入了动态分析，提出了“精炼纳什均衡”的概念。海萨尼J.Harsanyi把不完全信息引入博弈论的研究。克瑞普斯Kreps和威尔逊Wilson 1982年合作发表了关于不完全信息动态博弈的重要论文。,专栏11-1：博弈论在微

3、观经济学中的重要性 1博弈论与新古典经济学新古典经济学研究的是当外部条件既定时，单个厂商（消费者）的最大化决策问题，即在给定一个价格参数和成本（收入）的条件下，最大化其利润（效用），厂商利润（个人效用）函数只依赖于他自己的选择，而不依赖于其他人的选择；个人的最优选择只是价格和成本（收入）的函数，而不是其他人选择的函数。对单个人来说，其他人对其的影响都被总结在一个参数价格里，决策时，他既不考虑自己的选择对别人选择的影响，也不考虑别人选择对自己的影响。但是，新古典经济学的分析有两个假定条件：一是市场参与者数量足够多，从而市场是竞争性的；二是双方不存在信息不对称的问题。第一个条件在现实中并不具备

4、，在市场参与者人数有限的情况下，即在不完全竞争市场上,人们之间的行为是直接影响的，所以，一个人在决策时，必须考虑对方的反应，这就是博弈论研究的内容。同时，当信息不对称时，非价格制度会出现，其显著特征是，参与人之间行为的相互作用，因此，博弈论又成为分析非价格机制的重要工具。 2博弈论与诺贝尔经济学奖（1）博弈论与诺贝尔奖的授予 1994年诺贝尔经济学奖授予了三位博弈论专家：纳什、泽尔滕和海萨尼。而1983年，英国wheatsheaf出版社出版的，由当代在世的最著名的经济学术史专家Mark Blaug根据社会科学文献引证索引编写的一本经济学家名人录中，收录了从1970年到1981

5、年间在世的674位，去世的397位，共计 1071位经济学家的传记。在这本名人录中，没有纳什和泽尔滕，只有海萨尼，但其名字下注着NE，即没有条款，原因是他自己没有编写简历。而仅仅十几年后，三人就获得了诺贝,尔经济学奖，说明了博弈论和经济学发展的迅速。 2005年度诺贝尔经济学奖则授予持有以色列和美国双重国籍的罗伯特奥曼和美国公民托马斯谢林。瑞典皇家科学院说，两位经济学家获奖是因为“他们通过对博弈论的分析加深了我们对冲突与合作的理解”。这是自1994年之后，博弈论学者再获诺贝尔经济学奖。谢林，执教于美国马里兰大学经济学系，同时也是哈佛大学名誉教授。按照评委会的认定，谢林的贡献，

6、在于显示“某一方可以显而易见地限制自己的选择，以此强化自身的（竞争）地位；报复的能力可以比之抵御攻击的能力更为有用；以及不确定的报复比之确定的报复更为可靠和更为有效。”评委会说，这些见解“已经证明与化解冲突和努力避免战争有着相当大的关联”。奥曼执,教于耶路撒冷希伯来大学理性分析中心。奥曼和谢林之所以一同获奖，是因为他们“以博弈论分析方式增进了我们对于冲突与合作的理解。”具体到经济领域，他们帮助“解释了诸如价格战和贸易战之类的经济冲突，以及为什么一些社区相对于其他社区在管理共有资源方面更为成功。” （2）国外流行教科书中的博弈论 Hal Varian的微观经济分析Microec

7、onomic Analysis是一本在欧美非常流行的高级微观经济学教科书，几乎所有大学的研究生课程都用这本书。在1984年的第二版中，没有博弈论，甚至书后词汇表中也没有“博弈论”一词。但在1992年第三版就加上了“博弈论”一章，而且有关寡头竞争这一章也按博弈论理论重写了。,克瑞普斯David Kreps1990年出版的微观经济理论教程 A Course in Microeconomic Theory 是1991年最畅销的经济学教科书，被相当多欧美名牌大学选为研究生教材，其中第三部分就是“非合作博弈”，共219页，占全书的比重超过28%，其本人就是博弈论专家。1990年他因对博弈论的贡献

8、获得美国“克拉克奖”Clark Medel。泰勒尔Jean Tirole1988年出版的产业组织理论一书，是目前最受欢迎的、最流行的产业组织理论教科书，全书的内容都建立在非合作博弈的基础上，以至于作者不得不在最后加上一章“非合作博弈论”，供不熟悉的读者参考。,相关链接111 从日常生活看“博弈论” “博弈论” 原本是数学的一个分支，但由于它较好地解决了对于竞争等问题的可操作性分析，成为经济学中激荡人心的一个研究领域。可以说， “博弈论”已经改变了经济学的传统轮廓线。“博弈论” 的英语原文是game theory ，直译过来就是游戏论、运动论或竞赛论。譬如，在足球比赛中，双方

9、都想在努力巩固防守的同时，积极进攻以置对方于“死地” ，这种行为就是一种博弈。“弈” 在汉语中是下棋的意思，下棋中的双方行为特征也如同足球比赛中双方的行为。当然，扩展开来讲，企业之间的竞争、国家之间的角力等，都是“游戏” ，只是游戏的内容不同而已。我国古代有个“田忌赛马” 的故事，说的是齐威王与大将田忌各出三匹马一对一比赛三场，由于齐威王的最优、次优和较差的三匹马分别跑得比田忌的三匹马快，所以田忌总是以0：3告负。后来田忌的谋士孙膑给田忌出主意，让,最差的马去与齐威王最快的马比，而让最优的马去赢齐威王次优的马，让次优的马去赢齐威王最差的马，这样便以2：1 取胜。

10、但我们还可进一步设想，如果齐威王知道了田忌的花招后，便会在以后的比赛中也更改出马的次序，当然田忌的出马次序也应改动。双方的出马次序怎样才是最合理的呢？这便是“博弈论” 更深层次研究的问题了。 2002 年度获奥斯卡大奖的影片枟美丽心灵枠中主角的原型，便是“博弈论”中纳什均衡的创立者约翰纳什。影片中有这样一个情节：在美国普林斯顿大学的酒吧里，个男生正商量着如何去追求一位漂亮女生，当时还正在大学读书的纳什却在朦胧的“博弈论” 思维逻辑引导下喃喃自语： “如果他们个人全部去追求那漂亮女生，那她一定会摆足架子，谁也不睬。然后再去追其他女孩子，别人也不会接受，因为没人愿意当次品。但

11、如果他们先追其他女生，那么漂亮女生就会感到被孤立，这时再追她就会容易得多。” 在纳什眼里，追求女生就是一场“博弈” ，而“博弈” 是要遵循一定的规则的，是需要“博弈” 策略的。,我们再从经济决策上来看“博弈论” 。假如你是一个公司的老总，你在决定是否将自己的产品降价以及降价多少时，必须首先要考虑至少以下几个方面的问题：消费者将会增加购买吗？大概会增加多少购买量呢？其他同种产品的厂家也会降价吗？等等。你只要是理性的话，一定会在对这些问题进行考虑的基础上来作出你的决策。所以说，“博弈论” 主要是研究各相关行为主体的决策行为相互影响、相互作用的假定条件下，理性的行为主体如何决策，以及这种

12、决策的均衡等问题的。在这里，决策均衡是一个经济学概念，意味着最佳决策或最佳决策的组合。因为只要决策是最佳的，相关的行为主体就不会去改变它，从而使它处于稳定、均衡的状态。再简而言之，“博弈论” 就是分析博弈行为和博弈决策的一门科学。资料来源：叶德磊：从日常生活看“博弈论” ，文汇报， 2005 年10月23 日。,(三)博弈的要素构成博弈的要素主要包括参与人、行动、战略、支付、信息、均衡、结果等。 1.参与人players 一个博弈中的决策主体，其目的是通过选择战略（或行动），以最大化自己的支付（效用）水平。 2.行动actions or moves 行动是参与人在博弈的某个时点的决策变

13、量。 1行动集合action set：可供某个参与人（i）选择的所有行动的集合，写作Ai=ai。 2行动组合action profile：n个参与人的行动的有序集 a=(a1,ai,an)。 3行动顺序the order of play：根据行动顺序，可以将博弈分为静态博弈和动态博弈。因此，行动顺序对于博弈结果非常重要。,3.战略strategies 参与人在给定信息集的情况下的行动规则，它规定参与人在什么时候选择什么行动。战略与行动是不同的概念，战略是行动的规则而不是行动本身，战略要说明什么时候采取什么行动。例如“人不犯我，我不犯人；人若犯我，我必犯人”，就是一个战略，而“犯”与“不

14、犯”是两种行动，这一战略规定了什么时候选择“犯”与“不犯”的行动。可以有的战略还包括：“人不犯我，我必犯人；人若犯我，我不犯人”；“人不犯我，我不犯人；人若犯我，我还不犯人”；“人不犯我，我必犯人；人不犯我，我还犯人”等。在静态博弈时，战略与行动是相同的，因为作为参与人行动的规则，战略必须依赖于参与人获得其他参与人行动的信息，而在静态博弈中，双方同时行动，从而不可能获得对方行动的信息，因此战略选择就变成简单的行动选择。战略必须是完备的。它要给出参与人在每一种可想象到的情况下的行动选择，即使参与人并不预期到这种情况会实际发生。,（1）战略集合strategy set：某参与人i所有可选择的战

15、略的集合。Si=si。（2）战略组合strategy profile：n个参与人每人选择一个战略的n为向量。s=(s1,si,sn)。 4.支付pay off 在一个特定的战略组合下，参与人得到的确定的效用水平，或者是指参与人得到的期望效用水平。支付是博弈参与人真正感兴趣的东西。博弈的一个基本特征是，一个参与人的支付不仅取决于自己的战略选择，而且取决于所有其他参与人的战略选择。 5.信息information 参与人有关其他参与人的特征、战略、行动、支付等的知识共同知识common knowledge：“所有参与人知道，所有参与人知道所有参与人知道，所有参与人知道所有参与人

16、知道所有参与人知道”的知识。,6.均衡equilibrium 所有参与人的最优战略的组合，记为s*=(s1*,si*,sn*)。 7.结果outcome 即博弈均衡产生的博弈的最终后果，包括均衡及其支付。（五）博弈的分类 1.根据博弈参与人划分（1）单人博弈。其实质是个体的最优化问题，即在一定条件下选择最优战略。单人博弈区别于两人博弈和多人博弈的根本之处在于，博弈的信息越多，支付越高。（2）两人博弈。参与人为两人的博弈。（3）多人博弈。三个或三个以上参与人的博弈。其与单人博弈和两人博弈最大的区别在于，可能存在“破坏者”，即具有下列特征的参与人：其策略选择对自身支付没有任何影响

17、，但却会影响其他参与人的支付，有时甚至是决定性的影响，如奥运会申办。,2.根据战略划分（1）有限博弈（finite game）。一个博弈被称为有限博弈，如果，第一参与人个数是有限的；第二，每个参与人可选择的纯战略是有限的。它可以用矩阵式、扩展式，甚至罗列方式表示。（2）无限博弈（infinite game）。不符合上述两个条件的博弈。一般用数集或函数式表示。 3.根据支付划分（1）零和博弈。无论各参与人如何决策，最后的社会总支付，即各参与人支付之和总是为零。如猜谜游戏。一是各参与人之间的利益是对立的，相互之间难以和平共处；二是各参与人为了多得利益，总不希望对方知道自己选

18、择的战略，因此，这种博弈的结果是不能完全确定的；三是即使进行重复多次的博弈，也不会产生新的机会或可能。,（2）常和博弈。各参与人支付之和总是等于一个非零常数。如分配固定数额的奖金。各参与人之间的利益关系也是对立的，但较易取得妥协，因而往往有一个确定的结果。在重复博弈中，由于总支付增加，会创造出许多新结果。（3）变和博弈。在不同的战略组合下，各参与人支付之和是不同的。是博弈的一般形式。 4.根据参与人行动次序划分（1）静态博弈。参与人同时进行战策选择、同时行动；虽然各参与人做出决策的时间不一定真正一致，但至少在其作出各自选择前都不知道其他参与人的战略选择；或在指导其他参

19、与人战略选择后不能改变自己已经做出的选择。,（2）动态博弈。各参与人先后、依次进行选择、行动，而且后选择、行动的参与人在自己选择前一般能看到此前其他参与人的选择、行动的博弈。参与人之间存在不对称性。后行为的参与人可根据先行动的参与人的行动作出针对性选择，而先行动的参与人在决策时，不但看不到后行动参与人的选择，而且还要考虑后行动参与人的反应。（3）重复博弈。同一博弈反复进行所构成的博弈过程。构成重复博弈的一次性博弈称为“原博弈”或“阶段博弈”，其一般是静态博弈。重复博弈的最少重复次数是两次。其中，到一定重复次数后肯定要结束的重复博弈称为“有限次重复博弈”。而无限次重复进行的博弈叫“无限次

20、重复博弈”。在重复博弈中，考察的重点不是某一次重复的结果或支付，而是原博弈重复进行后的总体效果或平均效果，因此，不能把重复博弈割裂为一次次独立的博弈进行分析，而是要将它们作为一个完整的过程和整体进行分析，因此，重复博弈是一种特殊的动态博弈。在重复博弈中，一次静态博弈中的均衡可能会发生变化。,5.根据参与人对其他参与人等的信息划分（1）完全信息博弈（complete information）。若各参与人都完全了解所有参与人的特征、战略、行动，以及在每种战略组合下的支付，并且不存在事前的不确定性，该博弈称为“完全信息博弈”。（2）不完全信息博弈（incomplete information）

21、至少存在部分参与人不完全了解其他参与人相关情况的博弈，称为“不完全信息博弈”。 6.根据参与人对博弈进程信息，对动态博弈进行划分（1）动态博弈中，若某参与人行动时，对此前行动的各参与人（包括“自然”）的选择、行动完全了解，称为“具有完美信息的”参与人。若其不完全了解此前全部的博弈进程，称为“具有不完美信息的”参与人。,（2）如果动态博弈中的所有参与人都是具有完美信息的，则该动态博弈称为“完美信息动态博弈”，perfect information。若动态博弈中存在具有不完美信息的参与人，该博弈称为“不完美信息动态博弈”，（imperfect information）。二、完全信

22、息静态博弈（一）博弈的战略式表述（strategic form representation） 1.战略式表述又称为标准式表述normal form representation 在这种表述中，所有参与人同时选择自己的战略，所有参与人选择的战略一起决定每个参与人的支付。需要注意得是参与人“同时选择”的是战略，是参与人行动的全面计划和准则，而不是行动。因此，战略式表述也可以用来描述动态博弈。,2.战略式表述的组成及表示（1）博弈的参与人集合：i； =(1,2,n) （2）每个参与人的战略空间：Si,i=1,2,n；（3）每个参与人的支付函数：ui(s1,si,sn)，i=1,2,n

23、。所以，G=S1,Sn；u1,un代表战略式表述博弈。 3.两人有限博弈的战略式表述的矩阵表述例：囚犯困境prisoners dilemma,（二）占优战略均衡 1.占优战略（dominant strategy）是指无论其他参与人选择什么战略，该参与人的最优战略是唯一的，这样的最优战略被称为 “占优战略”。例如，在 “囚犯困境”中，“坦白”是囚犯A的占优战略，“坦白”也是囚犯B的占优战略。 2.占优战略均衡（dominant-strategy equilibrium）是指在一个博弈里，如果所有参与人都有占优战略存在，则所有参与人占优战略所组成的战略组合称为“占优战略均衡”。例如，在上例“囚

24、犯困境”中，（坦白，坦白）就是占优战略均衡。这时，个人理性与集体理性产生了冲突。需要注意得是占优战略均衡只要求每个参与人是理性的，不要求“每个参与人是理性的”是共同知识。,（三）重复剔除的占优均衡 1.例子：“智猪博弈” 在绝大多数博弈中，占优战略均衡是不存在的。在“智猪博弈”中，按下按钮可有8个单位食物，但要支付2单位成本。若大猪先到，大猪吃7个单位，小猪吃1个单位；小猪先到，各吃4个单位；同时到，大猪吃5个单位，小猪吃3个单位。本例中，尽管 “等待”是小猪的占优战略，但大猪没有占优战略，因此，本博弈没有占优战略均衡。,2.重复剔除严格劣战略和重复剔除的占优均衡（iterated domi

25、nance equilibrium）（1）劣战略第一，严格劣战略 1）定义令si和si是参与人i可选择的两个战略（即 siSi, siSi）。如果对于任意的其他参与人的战略组合s-i，参与人i从选择si得到的支付严格小于从选择si得到的支付，即ui(si，s-i) ui(si，s-i) s-I 我们说，战略si严格劣于战略si（siis strictly dominated by si）。 2）例子：在“智猪博弈”中，对于小猪，“按”严格劣于 “等待”。,第二，弱劣战略 1）定义战略si弱劣于战略si（siis weakly dominated by si），如果对于所有的s-i，

26、ui(si，s-i) ui(si， s-i)s-i，且对于某些s-i，严格不等式成立。 si称为相对于si的弱占优战略。 2）例子：在“智猪博弈”中，若“-1”变为“0”，则对于小猪，“按”弱劣于“等待”。（2）重复剔除（严格）劣战略第一，思路首先找出某参与人的（严格）劣战略（假定存在），把这个（严格）劣战略剔除掉，重新构造一个不包含已剔除战略的新博弈；然后再剔除这个新博弈中的某个参与人的（严格）劣战略；继续这个过程，一直到只剩下一个唯一的战略组合为止。,第二，例子在“智猪博弈”中，先剔除小猪的“按”战略，再剔除大猪的“等待”战略，剩下唯一的战略组合是（按，等待）。这里，小猪

27、是“搭便车者”free rider。（3）重复剔除的占优均衡如果一个战略组合是重复剔除劣战略后剩下的唯一的战略组合，它被称为“重复剔除的占优均衡”。如果这种唯一的战略组合是存在的，称该博弈为“重复剔除占优可解的”dominance solvable。如果重复剔除后剩下的战略组合不唯一，该博弈不是重复剔除占优可解的。 3.例子剔除的顺序是：右下左，（上，中）是博弈结果。,如果每次剔除的是严格劣战略，均衡结果与剔除顺序无关；但如果剔除的是弱劣战略，均衡结果可能与剔除顺序有关。因此，一般使用严格劣战略剔除。（5）重复剔除严格劣战略方法的缺陷重复剔除严格劣战略要求假定“参与人是理性的”是

28、共同知识。这一条件比占优战略均衡严格。这一方法对博弈结果的预测经常是不精确的，甚至许多博弈无法通过该方法找到均衡。例如：,（4）纳什均衡（Nash Equilibrium）许多不存在占优战略均衡，或重复剔除的占优均衡的博弈，却存在纳什均衡。 1.纳什均衡的含义纳什均衡是一个战略组合，当其余参与人不改变各自的战略选择时，某参与人也没有动力单独改变自己的选择，这一点对所有参与人都成立。这就意味着，在纳什均衡的战略组合中，每一个参与人的战略选择都是针对其他参与人战略组合的最优选择。纳什均衡的特征假定所有参与人签订一个协议，协议规定个参与人均选择纳什均衡中各自的战略。则这一协议必定是可以自动实施

29、的self-enforcing，否则，就不是纳什均衡。,专栏价格战博弈现在，我们经常会遇到各种各样的家电价格大战：彩电大战、冰箱大战、空调大战、微波炉大战这些大战的受益者首先是消费者。每当看到一种家电产品的价格大战，百姓都会“没事儿偷着乐” 。在这里，我们可以解释厂家价格大战的结局也是一个“纳什均衡” ，而且价格战的结果是谁都没钱赚，因为博弈双方的利润正好是零。竞争的结果是稳定的，即是一个“纳什均衡” 。这个结果可能对消费者是有利的，但对厂商而言是灾难性的。所以，价格战对厂商而言意味着自杀。从这个案例中我们可以引申出两个问题：一是竞争削价的结果或“纳什均衡” 可能导致一个有

30、效率的零利润结局；二是如果不采取价格战，作为一种敌对博弈论，其结果会如何呢？每一个企业，都会考虑采取正常价格策略，还是采取高价格策略形成垄断价格，并尽力获取垄断利润。如果垄断可以形成，则博弈双方的共同利润最大。这种情况就是垄断经营所做的，通常会抬高价格。另一个极端的情况是厂商用正常的价格，双方都可以获得利润。,从这一点，我们又引出一条基本准则： “把你自己的战略建立在假定对手会按其最佳利益行动的基础上。” 事实上，完全竞争的均衡就是“纳什均衡” 或“非合作博弈均衡” 。在这种状态下，每一个厂商或消费者都是按照所有的别人已定的价格来进行决策。在这种均衡中，每一企业要使利润最大化，消

31、费者要使效用最大化，结果导致了零利润，也就是说，价格等于边际成本。在完全竞争的情况下，非合作行为导致了社会所期望的经济效率状态。如果厂商采取合作行动并决定转向垄断价格，那么社会的经济效率就会遭到破坏。这就是为什么WTO 和各国政府要加强反垄断的意义所在。,2.划线法和纳什均衡的求解（1）划线法。一是对参与人i的每一个可选择战略，在参与人j使用最优反应战略时的支付下划横线。二是支付均有横线的战略组合就是纳什均衡 2例子：在上例中（下，右）是纳什均衡。,3.纳什均衡与占优战略均衡和重复剔除的占优均衡纳什均衡是比重复剔除的占优均衡，比占优战略均衡（适应性）条件更强的解的概念。（1）每一

32、个占优战略均衡都是纳什均衡，而每一个纳什均衡却未必是占优战略均衡；（2）用重复剔除严格劣战略方法，保留下的唯一的重复剔除的占优均衡，就是纳什均衡。（3）纳什均衡，不会被重复剔除严格劣战略方法剔除掉（但弱劣战略剔除，可能会剔除纳什均衡）；（4）经重复剔除严格劣战略之后，有不唯一的多个战略组合保留，其中有的战略组合不一定是纳什均衡。即重复剔除严格劣战略方法，无法确保将所有非纳什均衡战略剔除，没有被剔除的战略组合不一定是纳什均衡。（5）没有占优战略均衡均衡的博弈，不能用重复剔除严格劣战略方法求解的博弈，可以有纳什均衡。,4.没有纳什均衡和多个纳什均衡（1）没有纳什均衡猜谜游戏matchin

33、g pennies 这是一个零和博弈。（2）多个纳什均衡性别战,（五）混合战略纳什均衡 1.混合战略（1）猜谜游戏的一个突出的特点是，每一个参与人都试图先知道对方的战略。一旦每方参与人都尽力知道其他参与人的战略选择，就不存在前面定义的纳什均衡，因为参与人此时的最优行为是不确定的，而博弈的结果必然要包含这种不确定性。（2）纯战略（pure strategies）。在给定信息的情况下，一个参与人的选择是其战略空间Si中的一个战略si。例如在猜谜游戏中，出正面就是出币人的一个纯战略，出反面也是他的一个纯战略。（3）混合战略（mixed strategies）。在给定信息的情况下，一个参与人的

34、选择是，以某种概率分布随机选择其战略空间中的一些或全部战略。例如，在猜谜游戏中，出币人以0.5和0.5 的概率随机选择出正面和出反面就是一个混合战略；以0.8和0.2的概率随机选择出正面和出反面是其另一个混合战略。纯战略是混合战略的一个特例。,（4）注意第一，一个给定的纯战略，可能会严格劣于一个混合战略，即是这个纯战略并不严格劣于其他任何一个纯战略；第二，一个给定的纯战略，可以是针对对方参与人一个混合战略的最优反应，即使这一纯战略并不是针对对方参与人任何一个纯战略的最优反应。 2.混合战略纳什均衡（1）混合战略纳什均衡的含义混合战略（P1*,P2*）是纳什均衡的充要条件是：每一个参与人

35、的混合战略是另一个参与人混合战略的最优反应，即V1（P1*,P2*）V1（P1,P2*）,和V2（P1*,P2*）V2（P1*,P2）同时成立。（即对于参与人2的混合战略P2*，参与人1选择P1*的期望收益大于（不小于）自己选择其他战略的期望收益。这一点对于参与人2也成立。）,（2）混合战略纳什均衡的求解第一，支付最大化方法- 以猜谜游戏为例假定“出币人”的混合战略为h=（，1-），即“出币人”以的概率选择出正面，以1-的概率选择出反面。 “猜币人”的混合战略为a=（，1-），即“猜币人”以的概率选择猜正面，以1-的概率选择猜反面。 “出币人”的期望效用为： Vh（h，a）=-1+1（

36、1-）+（1-） 1+（-1）（1-）=（2-4）+（2-1）对上述效用函数求微分，得到“出币人”效用最大化的一阶条件为： =2-4=0；*=0.5 在混合战略纳什均衡中，“猜币人”以0.5的概率猜正面，以0.5 的概率猜反面。,同样，“猜币人”的期望效用为： Va（h，a）=1+（-1）（1-）+（1-）（-1）+1（1-） =（4-2）+（1-2）对上述效用函数求微分，得到“猜币人”效用最大化的一阶条件为： =4-2=0；*=0.5 即在混合战略纳什均衡中，“出币人”以0.5的概率出正面，以0.5 的概率出反面。在猜谜游戏中，*=0.5，*=0.5是唯一的纳什均衡。,第二，支付等

37、值法 “出币人”出正面的期望收益为：（-1）+1（1-）=1-2 “出币人”出反面的期望收益为：1+（-1）（1-）=2-1 当且仅当将以上随的变化用函数关系表达出来，就得到下图所示的反应对应=*（）。在这里，因为存在一个值，使得*（）有不止一个解，称*（）为“出币人” 的最优反应对应best-response correspondence，如果对于每一个值，*（）只有一个解，称*（）为“出币人” 的最优反应函数best-response function。,“猜币人”猜正面的期望收益为： 1+（-1）（1-）=2-1 “猜币人”猜反面的期望收益为：（-1）+1（1-）=1-2 当且仅

38、当将以上随的变化用函数关系表达出来，就得到下图所示的反应对应=*（）。,最优反应对应*（）和*（）的交点就是混合战略纳什均衡。如果“出币人”的战略是（0.5，0.5），“猜币人”的最优反应就是（0.5，0.5）；反之，亦成立。第三，注意（1）一个混合战略要成为对方参与人战略s2的最优反应，混合战略中每一个概率大于零的纯战略本身也必须是对s2的最优反应。（2）如果参与人1有n个纯战略都是对方参与人战略s2的最优反应，则这些纯战略全部或部分的任意线性组合（同时，其他纯战略的概率为零）形成的混合战略同样是参与人1对s2的最优反应。,（六）纳什均衡的存在性 1.四种均衡的关系占优战略均衡DS

39、E、重复剔除的占优均衡IEDE、纯战略纳什均衡PNE和混合战略纳什均衡MNE，每个均衡概念依次是前一个均衡概念的扩展，或者说，前一个均衡是后一个均衡概念的特例。如果将在某个适当定义的均衡的所有博弈定义为一个集合，那么，存在前一个均衡的集合依次为存在后一个均衡的集合的子集。如图：一般，将上述四个均衡概念统称为纳什均衡NE。,2.纳什均衡的存在性是不是所有的博弈都存在纳什均衡？不一定。纳什于1950年证明，每一个有限博弈，至少存在一个纳什均衡（纯战略纳什均衡或混合战略纳什均衡）。（这里，有限博弈指，博弈有有限个参与人，且每个参与人有有限个纯战略）。三、不完全信息静态博弈和动态博弈的主要思路

40、（一）完全信息动态博弈完全信息静态博弈的纳什均衡存在三个问题：第一，一个博弈可能有不止一个纳什均衡，哪个纳什均衡会发生是不知道的，例如“性别战”博弈；第二，在纳什均衡中，参与人在选择自己的战略时，把其他参与人的战略当作给定的，不考虑自己的选择如何影响对手的战略。这一假设只适合静态博弈，在动态博弈下就不适合了；第三，由于不考虑自己选择对别人选择的影响，纳什均衡允许不可置信威胁的存在。,例如：“市场进入阻挠”（entry deterrance）博弈已经在市场上的垄断企业称为“在位者”，试图进入的新企业称为“进入者”，博弈矩阵如下这个博弈的纳什均衡有两个：（进入，默许），（不进

41、入，斗争）。对于进入者，在位者发出“你进入我就斗争”的威胁是不可置信威胁，因为，进入者如果进入，在位者的最优行动是默许。但是纳什均衡承认了这种不可置信威胁，于是（不进入，斗争）成为了一个纳什均衡。于是，泽尔腾定义了“子博弈精炼纳什均衡”，中心意义是将纳什均衡中包含的不可置信威胁战略剔除出去。,（二）不完全信息静态博弈在不完全信息下，某个博弈参与人对对方的特征（生产函数）、战略空间、各种战略组合下的支付等并不是全部了解。海萨尼（1967-1968）的贡献就是引入一个虚拟的参与人“自然”，自然首先行动选择参与人的“类型”。被选择的参与人知道自己的真实类型，其他参与人只知道被选择的参与人的各种

42、可能类型的概率分布。而且，这一概率分布是共同知识。海萨尼的上述工作称为“海萨尼转换”（the Harsanyi transformation）。这样，“不完全信息博弈”（games of imcomplete information）就变成了“完全但不完美信息博弈”（complete but imperfect information）。这里，“不完美”是指，自然做出了他的选择，但其他参与人并不知道他的选择是什么，仅知道各种选择的概率分布。,在这个基础上，海萨尼定义了“贝叶斯纳什均衡”。贝叶斯均衡是纳什均衡在不完全信息中的扩展。其含义是，在不完全信息静态博弈中：（1）参与人同时行动，所以不

43、能观察到别人的选择。给定别人的选择，每个人的最优战略依赖于自己的类型。（2）每个参与人只知道对方的类型的概率分布，而不知道对方真实类型，所以他不知道对方实际的战略选择。但是他知道其他参与人的战略选择是如何依赖于其各自类型的。（3）于是，参与人的决策目标就是，在给定自己的类型和别人的类型依从战略的情况下，最大化自己的期望支付。于是，贝纳斯纳什均衡是这样一种类型依从战略组合：在给定自己的类型和别人类型的概率分布的情况下，每个参与人的期望支付达到了最大化。,相关链接112 上海大众营销策略博弈分析上海大众凭借其在中国内地市场近年的积累，已成为中国轿车市场的一线领军厂商。但现在上海大

44、众面临着更多市场进入者的挑战，其垄断地位受到威胁，市场占有率逐渐萎缩。而新进入的厂商除了不断推出新车型占领细分市场外，其蚕食市场的最主要手段就是以相对较低的价格冲击市场。面对激烈竞争，上海大众也在竭力维护其车坛老大的地位，其技术含量高的新车型投放市场的步伐明显加快。但是从整体上看，上海大众的价格与新进入的厂商相比依然坚挺。并且，上海大众的有关负责人公开在媒体上表示 “市场的领导者是不会主动降价的” ， “上海大众汽车质量好，故其造车成本高，实际上单车利润已经很低” 。本文针对上述说法，以价格作为切入点，用博弈论来分析上海大众市场营销策略的有效性。,为简

45、便起见，我们将上海大众视为博弈的一方，而将所有的竞争对手视为博弈的另一方（对手）。两个博弈矩阵分别表示上海大众为高成本企业和低成本企业，我们可以看看在这两种情况下，其对手是否进入市场。以上是一个不完全信息静态博弈，即对手具有不完全信息，而上海大众具有完全信息。可知：（）给定对手进入市场的情况下，上海大众选择低价斗争行动还是高价合作行动，取决于其成本类型。如果它是高成本企业，则高价合作是最优策略；如果它是低成本企业，则低价斗争是它的最优策略。（）对手不知道上海大众的真实成本类型。假定对手知道上海大众为高成本企业的概率为P ，则对手选择进入时的

46、期望利润是40P+(-10) （1-P）0 ，解得P* 0.2 ，即P* 0.2 时，对手进入市场。也就是说，对手是否进入市场依赖于它“知道” 上海大众为高成本企业的概率，这是对手对于可能性的一种主观判断。,（）显然，对于处在垄断地位的博弈一方，若是低成本企业，它将在博弈中占据最主动的地位，因为它可以通过采取单一的低价行动向对手发出信号，从而获取最大利润。在不完全信息动态博弈中，垄断者降低价格并非是为了放弃最大利润，而是向进入者传达自己低成本的信息。这样，如以上博弈矩阵所示，对手进入就会无利可图，只能选择不进入，从而达到垄断者维护市场地位、继续占有垄断利

47、润的目的。上海大众营销策略博弈分析的结论：（）如果上海大众是高成本企业，并且对手也深知其作为高成本企业的概率超过一定的P倡而采取进入行动时，上海大众的最优行动是高价合作。这样，虽然将一部分垄断利润分给对手，自己还能够保持一定的利润。就目前上海大众坚挺的价格特点而言，可以视同高价策略，这是当上海大众作为高成本企业并且这一点被对手以较大概率确认后，它所能采取的最优策略。从这个意义上讲，上海大众目前的高价策略是正确而有效的。,（）既然是不完全信息博弈，那么上海大众作为高成本企业这一信息就不应该透露给对手。也就是说，即便上海大众是高成本企业，如果此时上海大众发出低成本的

48、信号，并能影响到对手以为其为高成本企业的概率P ，则对手会选择不进入，这样，上海大众仍将获得原有的利润。而上海大众“单车成本高” 的说法直接向对手发出了一个使P 增大的信号，虽然这种信号并不可靠，但它却会产生严重的负面影响。从市场营销及博弈的角度来看，这无疑是一个败笔。（）既然是不完全信息动态博弈，那么上海大众作为垄断者，完全可以主动降低价格，即向对手发出其低成本的信号，逼迫对手不进入市场。而上海大众“市场领导者是不会主动降价的” 这一说法有悖于最优价格策略。（）上海大众“单车利润已经很低” 的市场营销宣传是极为不妥当的。首先，消费者在乎的是汽

49、车的销售价，而不是厂家利润的多少。,其次，大家都知道，汽车的研发环节是需要很大的资金投入的，需要相对比较高的利润率作为支撑，而上海大众自己说自己的利润率很低，会引发人们对其后续研发能力的担忧，从而影响其客户的品牌忠诚度。（）上海大众“高质量要求高成本，也就导致了高价格” 的逻辑是不能令人信服的。高质量并不必然要求高成本，否则怎么会有“物美价廉” 之说呢？并且，上海大众拥有世界上最先进的造车技术，而先进技术的使用以及大规模生产，应该是有利于降低单车成本的。因此，上海大众“高质量要求高成本” 的说法如果成立，那么，我们就可以认为上海大众存在X 低效率现象，即生产未能达到现有技术条件下的生产可能性边界。也就是说，上海大众有可能因为曾经的垄断使得它减少了

展开阅读全文