第十三章博弈论和竞争策略.ppt

资源描述

《第十三章博弈论和竞争策略.ppt》由会员分享，可在线阅读，更多相关《第十三章博弈论和竞争策略.ppt（37页珍藏版）》请在三一文库上搜索。

1、第十三章博弈论和竞争策略,几个经典的博弈,囚徒的困境赌胜博弈性别之战,囚徒的困境与破解,囚徒的困境是图克（Tucker）1950年提出的该博弈是博弈论最经典、著名的博弈该博弈本身讲的是一个法律刑侦或犯罪学方面的问题，但可以扩展到许多经济问题，以及各种社会问题，可以揭示市场经济的根本缺陷。上一章我们发现寡头市场存在囚徒困境。囚徒困境还在我们生活中的很多地方存在，例如军备竞赛等等。,囚徒困境的破解合作,在这里我们不妨将条件放宽，允许囚犯A和B在审讯室李一起单独呆上10分钟，然后再决定是否坦白。很明显，双方交流的主旨就是建立攻守同盟，克服自利心理，甚至可能订立一个口头协议，要求双方都不去

2、坦白。然后，双方再单独被提审。我们不妨设想，囚犯A的心理，他一定会认为，如果囚犯B遵守约定的话，则自己坦白就可获得自由；如果囚犯B告密的话，若不坦白就会被终生囚禁。事实上，囚犯A的策略并没有因为简单的沟通或协议而摆脱两难境地。恋人们在恋爱中的海誓山盟，最终还是分手；企业之间相互沟通信誓旦旦，价格战仍然会爆发；美苏两国经常会晤，甚至签订核不扩散条约，但军费一年高过一年。这些现象都反映了上面所说明的问题。,囚徒困境的破解合作,以协议形式的合作，具有约束力，实际上是改变了得益矩阵。例如，存在一个黑帮老大，他告诉两个囚徒，如果因为坦白而让自己的兄弟坐牢，坦白的人将被做掉，那么囚徒的困境也就破解了。

3、因为此时的得益矩阵已经改变。,-3，-3,-5，-5,-100，-10,-10，-100,不坦白,不坦白,坦白,坦白,囚徒B,囚徒A,囚徒困境的破解实例,1971年，美国国会通过了禁止在电视上做烟草广告的法律。令许多人奇怪的是，财大气粗的各大烟草公司反应相当平静，并没有动用其庞大的社会资源和影响力阻止这个法律的通过。政府管制最终的结果是，尽管烟草广告因受到限制而减少，可是烟草公司的利润却提高了。实际上，政府禁令不仅没有打击烟草公司，反而是把陷入白热化广告战的各大烟草集团从“囚徒困境”中解放了出来。这个时候国家出台法令对于烟草行业来说反而是个好事，烟草公司靠自己做不到的事情，政府做到了。因为国

4、家法律具有强制性的作用，相当于是烟草集团之间签订了极具约束力的协议，同时政府承担了监督烟草公司是否违反协议的成本。,囚徒困境的破解重复博弈,囚徒的困境是静态的，因而是有限的博弈，双方实际上只进行一次博弈，而在现实生活中，博弈往往是重复的。在经济中面临囚徒困境的双方，在每次的博弈中，各厂商都会造成关于他们的行为的名声，并且研究他们的竞争者的行为。下图是一个囚徒的困境，假设这个博弈一次次的重复进行，例如，你和你的竞争者每个月的头一天同时宣布你们的价格，此时应该如何选择策略？,重复博弈中的策略选择,罗伯特阿克赛罗的研究表明，在重复博弈中“针锋相对”（以牙还牙）的策略是最有策略。即，我从一个高价开始

5、，只要你继续合作，也定高价，我就会一直保持下去，一旦你降低你的价格，我马上也会降低我的价格，如果你以后决定合作并在提高价格，我马上也会提高我的价格。对于无限重复的博弈，针锋相对是可行的，而且往往会破解囚徒的困境，即双方都定高价，或者说两个囚徒都不坦白。考虑一下，在有限次博弈中，又会如何？,重复有限次博弈的策略选择,假设博弈只进行有限次数N个月。如果我们的竞争者是理性的，并且相信我也是理性的，它就可以这样推理：“因为对手采取以牙还牙的策略，我在最后一个月之前不能削价竞争，我应该在最后一个月削价，这样我在最后一个月就能赚到较大的利润，接着博弈就结束了，竞争者也没办法报复”。可是我们也会这样想，

6、即在最后一个月定低价。由于我们和竞争者都是理性的，他也会预料到我在最后一个月会定低价，从而他会在倒数第二月就定低价，同样的道理我也会在倒数第二月定低价最后，我们又落入了囚徒的困境。在实际中，虽然博弈是有限次的，但是由于厂商们不知道博弈会进行多久，最后一个月降价的基础就不存在了，这时候厂商们就会像在无限博弈中一样采用针锋相对的策略。佛家讲因果律，儒家讲究“财自道生，利缘义取”。从囚徒困境看来，如果一味地想算计别人，算来算去，最后算计到自己头上来了。如果我们将囚徒困境中的有期徒刑改为死刑，那么“机关算尽太聪明,反误了卿卿性命”用在这里是再恰当不过的了。,赌胜博弈与混合策略,赌博、竞技等构成的博

7、弈问题，在经济中也有许多应用，赌胜博弈也是一类重要的博弈问题，对经济竞争和合作也有很大启示。赌胜博弈的特点是一方得等于另一方失，不可能双赢，属于“零和博弈”。所谓纯策略是指参与者在他的策略空间中选取惟一确定的策略。有时，纯策略并不是博弈中的最佳策略。所谓混合策略是指参与者采取的不是惟一的策略，而是其策略空间上的概率分布。,赌胜博弈田忌赛马,取胜关键：不让对方猜到自己策略，尽可能猜出对方策略,最常见混和策略就是猜硬币游戏。比如在足球比较开场，裁判将手中的硬币抛掷到空中，让双方队长猜硬币落下的正反面。由于硬币落下是正是反是随机的，概率应该都是1/2。那么，猜硬币游戏的参与者都是1/2的概率选

8、择正与反，这时博弈达到混和策略纳什均衡。再比如我们儿时玩的“剪、布、锤”就不存在纯策略均衡，对每个小孩来说，自己采取出“剪”、“布”还是“锤”的策略应当是随机的。一旦一方知道另一方出其中某个策略的可能性增大，那么这个对弈者在游戏中输的可能性就增大。因此，每个小孩的最优混合策略是采取每个策略的可能性是l3。在这样的博弈中，每个小孩各取三个策略的13是纳什均衡。由此可见：纯策略是参与者一次性选取的，并且坚持他选取的策略；而混合策略是参与者在各种备选策略中采取随机方式选取的。在博弈中，参与者可以改变他的策略，而使得他的策略选取满足一定的概率。当博弈是零和博弈时，即一方所得是另外一方的所失时，此时只

9、有混合策略均衡。对于任何一方来说，此时不可能有纯策略的占优策略。,混合博弈警察与小偷,某个村庄上只有一名警察，他要负责整个村的治安。小村的两头住着两个全村最富有的村民A和B，A、B分别需要保护的财产为2万元、1万元。整个小村某一天来了个小偷，要在村中偷盗A和B的财产，这个消息被警察得知。因为分身乏术，警察一次只能在一个地方巡逻；而小偷也只能偷盗其中一家。若警察在某家看守财产，而小偷也选择了去该富户家，就会被警察抓住；若警察没有看守财产的富户家而小偷去了，则小偷偷盗成功。一般人会凭着感觉认为，警察当然应该看守富户A家财产，因为A2万元的财产而B只有1万元的财产。实际上，对于警察的一个最好的做法

10、是，警察抽签决定去A还是B家。因为A家的财产是B家的2倍，所以用两个签代表A家，比如如果抽到1、2号签去A家，抽到3号签去B家。这样警察有23的机会去A家进行做看守，13的机会去B家做看守。而小偷的最优选择是：以同样抽签的办法决定去A家还是去B家实施偷盗，只是抽到1、2号签去A家，抽到3号签去B家，那么，小偷有l3的机会去A家，23的机会去B家。这些数值是可以通过联立方程准确计算出的。,赌胜博弈猜硬币博弈,赌胜博弈石头、剪子、布,0， 0,1， -1,-1， 1,-1， 1,1， -1,0， 0,1， -1,-1， 1,0， 0,石头,剪子,布,博弈方2,石头,剪子,布,博弈方 1

11、,石头剪子布的策略探讨,从数学上来讲，最优玩法（根据博弈论）其实就是一种随机的选择，因此，当排除心理因素后，这是一个简单并且直观的游戏，就如同和计算机玩一样。但是，这里所说的“最优”是指不存在有比期望的随机概率更好的玩法。然而，对手如果不是采用“最优”策略，而是采用某种“次优”策略的话，采用随机玩法并不一定是最好的玩法。事实上，如果对手是人或者非随机程序的话，那么几乎可以肯定他采用的是某种“次优”策略，这种情况下，针对对手的弱点可以设计出一个更好的策略。基于这种思路而设计的Roshambot计算机程序，轻松击败了人类玩家（甚至包括它的开发者Perry Friedman，他曾经在2001年8月击

12、败7名对手，包括前世界扑克大赛冠军Phil Hellmuth，并赢得800美元的奖金）。选手之间的策略可包括应用心理学去预测，或者干扰对手的行为。使用迷惑性的语言（例如：“敦厚老实的石头哟，可是战无不胜的啊！”）去干扰对手的作法是允许的。真正的石头、剪子、布的比赛是一个有趣的心理学较量。石头、剪子、布的策略是随机地选一个，但是人类不能达到真正随机，所以比赛的技术在于利用对手的非随机性。某些有经验的选手能连续达到比赛决赛就能证明技术能影响比赛结果,性别之战,小两口偏好不同，男的喜欢足球，女的喜欢歌剧，但是他们更喜欢在一起进行活动。得益矩阵如下所示。在这个博弈中有两个纳什均衡。只要有事先的沟

13、通，两个纳什均衡都有可能实现。这个博弈还有一个混合策略均衡：男以2/3的概率选择摔跤，1/3的概率选择看歌剧；女的以1/3的概率选择摔跤，以2/3的概率选择看歌剧。你可以验证如果男的选择了混合策略，女的也只有选择混合策略，而没有其他更好的策略。在这个例子中混合策略所得到的结果是随机的，双方的期望得益都是2/3。,极大化极小策略,纳什均衡及其依赖于个人理性。各博弈方的策略选择不仅取决于自己的理性，也取决于对手的理性。如下图所示，如果博弈方2碰巧错误的选择了“左”，那对博弈方1来说损失就相当大了。所以如果博弈方1是一个谨慎的人，且考虑到博弈方2不一定清楚博弈或不一定理性，博弈方1可能选择“上”

14、，这将保证赚到1元，并不会损失1000元。这种策略就是极大化极小策略。极大化极小策略是最大化可能得到的最小得益。下图博弈中，博弈方1和博弈方2如果都采取极大化极小策略，极大化极小均衡解就是（1，1）。而（2，1）是这个博弈中的唯一的纳什均衡。博弈方2 左右博弈方1 上 1，0 1，1 下 -1000，0 2，1,生活中的博弈爱情故事,麦吉的礼物描述的这样一个爱情故事。新婚不久的MM和GG，很是穷困潦倒。除了MM那一头美丽的金色长发，GG那一只祖传的金怀表，便再也没有什么东西可以让他们引以为傲了。虽然生活很累很苦，他们却彼此相爱至深。每个人关心对方都胜过关心自己。为了促进对方的利益，他

15、们愿意奉献和牺牲自己的一切。话说明天就是圣诞节了，小两口都是身无余钱。为了让爱人过得好一点，每个人还是想悄悄儿准备一份礼物给对方。GG卖掉了心爱的怀表，买了一套漂亮发卡，去配MM那一头金色长发。MM剪掉心爱的长发，拿去卖钱，为GG的怀表买了表链和表袋。最后，到了交换礼物的时刻，他们无可奈何地发现，自己如此珍视的东西，对方已作为礼物的代价而出卖了。花了惨痛代价换回的东西，竟成了无用之物。出于无私爱心的利他主义行为，结果却使得双方的利益同时受损。,且让我们暂时抛开爱情的温馨，单从利益的角度来解读。我们假定，他们每个人，有一个“毫不利己专门利人”的偏好系统，毫不考虑自身利益，专门谋求别人的幸福。

16、这样，个人选择付出还是不付出，只看对方能不能得益，与自己是否受损无关。以这样的偏好来衡量，最好的结果自然是自己付出而对方不付出，对方收益增大；次好的结果是大家都不付出，对方不得益也不牺牲；再次的结果是大家都付出；最坏的结果是别人付出而自己不付出，靠牺牲别人来使自己得益。我们不妨可用数字来代表个人对这四种结果的评价：第一种结果给3分，第二种结果给1分，第三种结果给1分，最后那种给0分。不难看出，无论对方选择付出，还是选择不付出，个人自己的最佳选择都是付出。然而这并不是对大家都有利的选择。事实上，大家都选择不付出，明显优于大家都选择付出的境况。,生活中的博弈商店选址,假设有条完全笔直的公路，连接

17、城市A到城市B之间的交通。这条公路上每天行驶着大量的车辆，并且车流量在公路上是均匀分布的。假设有两家快餐店，我们不妨假设为靠高速公路起家的麦当劳与肯德基，它们要在这条公路上选择一个位置开设快餐，招揽来往车辆。通常情况下，车辆总是乐意到距自己最近的快餐店购买食物。考虑一下，肯德基和麦当劳会在公路的什么位置设立快餐店？,生活中的博弈陷阱,在一次大规模的宴会上，约翰从口袋里掏出一张千元大钞，向所有的来宾宣布：他要将这张千元大钞拍卖给出价最高的朋友，大家互相竞价，以50元为单位，到没有人再加价为止。出价最高的人只要付给约翰他所开的价码即可获得这张千元大钞，但出价第二高的人，虽无法获得千元大钞，仍需将

18、他所开的价码如数付给约翰。这个别开生面的“以钱卖钱”的拍卖会，立刻吸引了大家的兴趣。开始时，“100元”、“150元”、“200元”的竞价声此起彼落，到价码抬高到“500元”时，步调缓和了下来，只剩下三四个在竞价。最后只剩下杰克和比尔在那里相持不下。当杰克喊出“950元”时，约翰弹一弹他手上的千元大钞，暧昧地看着比尔，比尔似乎不假思索地脱口而出：“1050元！”这时会场里起了一阵小小的骚动。约翰转而得意地看着杰克，等待他加价或者退出，杰克咬一咬牙说：“2050元！”人群里起了更大的骚动，比尔摆一摆手，喝口酒，表示退出这个“疯狂的拍卖会”，大家才松了一口气。结果，杰克付出“2050元”，买

19、到那张“1000元”钞票，而比尔则平白付出了“1050元”。两人“平分秋色”，各损失的“1050元”都纳入了约翰的荷包。,这个游戏是耶鲁大学经济学家M苏必克发明的，想拍卖钱的人几乎屡试不爽地从这拍卖会里“赚到钱”。它是一个具体而微的“人生陷阱”，参与竞价的比尔和杰克在这个“陷阱”里越陷越深，不能自拔，最后都付出了痛苦的代价。社会心理学家A泰格曾对参加“千元大钞拍卖游戏”的人加以分析，结果发现掉入“陷阱”的人通常有两个动机，一是经济上的、一是人际关系上的。经济动机包括渴望赢得那张千元大钞、想赢回他的损失、想避免更多的损失；人际动机包括渴望挽回面子、证明自己是最好的玩家及处罚对手等。千元大钞就

20、是一个明显的诱饵。开始时，大家都想以廉价而容易的方式去赢得它，希望自己所出的价码是最后的价码，大家都这么想，就不断地互相竞价。当进行一段时间后，也就是出价相当高时，相持不下的两人都发现自己掉进一个陷阱中，但已不能全身而退，他们都已投资了相当多，只有再增加投资以期挣脱困境。当出价等于“奖金”时，竞争者开始感到焦虑、不安，发现自己的“愚蠢”，但已身不由己。当出价高过奖金时，不管自己再怎么努力都是“损失者”，不过，为了挽回面子或处罚对方，他不惜“牺牲”地再抬高价码，好让“对手损失得更惨重”。,在日常生活里，大至商场上的竞争，小至等候公车，都有“陷阱”在等待着你。比如公车平常是15分钟一班，当你花

21、在等待的时间超过10分钟后，你会开始烦躁不安，但通常你会继续等下去，等到超过15分钟公车还不来时，你除了咒骂外，也开始感到“后悔”你应该在15分钟前就走路或坐计程车去的。但通常你还会继续等下去，因为你已“投资了那么多的时间”，不甘心现在改坐计程车，结果就越陷越深，无法自拔，直到公车姗姗来迟，你心理的困境才获得解脱。在人生道路上，如何避免陷入“陷阱”，的确是一门不小的学问。而且“旁观者清，当局者迷”，一旦掉进人生的陷阱，抽身是不太容易的。为了避免陷入人生的陷阱，事先要明确切实可行的“预警值”事先确立你最多投入多少资金或时间等等。一旦超过了这个极限，就要勇敢地放弃或退出。,生活中的博弈猎鹿模型,

22、设想在原始社会，人们靠狩猎为生。某一天有两个猎人围住了一头鹿，他们各卡住鹿可能逃跑的两个路口中的一个。只要他们齐心协力，鹿就会成为他们的猎物，不过仅凭一个人的力量是无法猎捕到鹿的。如果此时周围跑过一群兔子，两位猎人中的任何一个只要去抓兔子一定会获得成功，他会抓住4只兔子。从能够填饱肚子的角度来看，4只兔子可以供一个人吃4天，1只鹿如果被抓住将被两个猎人平分，可供每人吃10天。这里不妨假设两个猎人叫A和B。我们引入一种矩阵式的对两人博弈的描述方法，见下图。,猎鹿模型有两个纳什均衡，如果没有其他条件，我们不知道哪一个结果会出现。比较两个均衡结果，（4，4）和（10,10）可以发现合作会带来帕累托

23、改进。猎鹿模型在经济领域的表现体现在广泛存在的“强强联合”上。猎鹿模型的引申不公平的分配制度与猎鹿模型。,动态博弈的扩展形表示,动态博弈：参与人有先后顺序，而且，后行者可以观察到先行者选择的博弈。例子：仿冒和反仿冒博弈,威胁、承诺和可信性,在此，我们要讨论厂商如何组织潜在的竞争者进入，或者促使竞争者提高价格、减少产量，或者干脆离开市场。策略性行动：一个策略性行动就是某人通过影响其他人对自己会如何行为的预期，以促使其他人采用对自己有利的选择的行为，是某人通过限制自己的行为来限制合作者的行为。为什么要通过限制自己的行为来限制竞争者的行为？答案：限制自己的行为是为了改变竞争者对自己的预期

24、。,空头威胁,我们看下边的例子。厂商A最想要的结果是左上角的结果。可是均衡会在右上角实现。厂商A为了实现左上角的结果可以威胁说如果厂商B定低价他也定低价。这样，对于厂商B来说，比左上角的结果80要少60。思考一下，厂商A的愿望会实现吗？,可信的威胁,再看下边的例子。厂商A的最好结果依然是左上角的结果，厂商B最好的结果仍然也是右上角的结果。此时厂商A威胁说，如果厂商B定低价，他也会定低价，这个威胁就是可信的了。,如何让威胁变得可信,1.限制自己的行动，即改变得益矩阵，让自己的威胁变得可信。 2.拥有非理性的名声。,对进入的威慑,进入障碍是垄断势力和利润的重要根源，这种进入障碍有时是自然形成的，

25、例如：规模经济、专利和许可证、关键投入品等。有时厂商自己也能阻止潜在的竞争者进入。为了阻止竞争对手的进入，已有厂商必须使竞争对手相信进入是无利可图的。下图的得益矩阵中，潜在的进入者就有动力进入市场。这时，即使原有厂商威胁要进行价格战，潜在的进入者也会进入市场，因为威胁是不可信的。,50，10,40，0,30，-10,100，0,进入,高价,不进,低价,潜在进入者,原有厂商,为了阻止潜在竞争者的进入，原有厂商必须使潜在竞争者相信，进入市场以后，原有厂商会打响价格战。一种方法就是，限制自己的行动，造成一种既成事实：竞争者进入市场以后，打价格战对原有厂商更有利可图。原有厂商可以通过投资过剩的

26、生产能力来实现这一点。请看下边的得益矩阵。当然如果原有厂商在以前的博弈中如果获得了非理性的名声，也可以在不投资过剩生产力的情况下，实现进入的威慑。,20，10,40，0,30，-10,70，0,进入,高价,不进,低价,潜在进入者,原有厂商,策略性贸易政策和国际竞争,先发制人的投资可以对潜在的竞争者造成一种可信的威胁而给厂商带来优势。在有些情况下，先发制人的投资、补贴或政府鼓励也能给一国带来国际市场上的优势，因而也是重要的贸易政策工具。我们先看一下，在国际市场上的先发制人的投资情况。假设波音和空中客车的得益矩阵如下，那么谁盈利将取决于谁先进行投资。,-10，-10,0，0,0，100,100

27、，0,生产,生产,不生产,不生产,空中客车,波音,如果存在政府的鼓励和补贴，得益矩阵就有可能发生改变。假设欧洲各国鼓励空中客车生产新飞机，并且对其进行20单位的补贴。则新的得益矩阵就如下图所示。,-10，10,0，0,0，120,100，0,生产,生产,不生产,不生产,空中客车,波音,讨价还价策略,假设两个厂商生产产品的得益矩正如右图所示。此时均衡点在右上角。但是厂商1更希望左下角的结果实现。假设此时有一个第三个厂商组织的合作联盟，厂商1、2加入合作的得益如右下图所示。此时厂商1能否说服厂商B生产产品A，从而实现左下角的均衡呢？在讨价还价过程中，把不同的问题联系在一起，有时能以他人的损失

28、为代价给某些人带来好处。,40，5,5，45,60，40,50，50,生产A,生产A,生产B,生产B,厂商2,厂商1,10，10,40，40,20，10,10，20,单干,单干,合作,合作,厂商2,厂商1,生产决策,加入合作决策,讨价还价的策略,有一套住房实际价格为25万，买方打算以不超过20万的价格购买，卖方打算以大于18万的价格出售。假设买方是唯一的买方，此时成交价会是多少？对于买方来说，买方可以声明他决不会以超过20万的价格购买房子。但是这一声明是不可信的（卖方不知道买方的价格底线）。如果买方采取策略性行动（限制自己的行动）这种声明就是可行的。例如买方和第三方打赌，“如果超过20万买房子，就输给你60万”。那么这时候声明就是可信的了。所以，灵活性越小，讨价还价的能力越强。,

展开阅读全文