第十章博弈论初步.ppt_三一文库31doc.com

资源描述

《第十章博弈论初步.ppt》由会员分享，可在线阅读，更多相关《第十章博弈论初步.ppt（66页珍藏版）》请在三一文库上搜索。

1、第十章博弈论初步 Game Theory,博弈论概述纳什均衡序贯博弈与重复博弈进入威慑,第一节博弈论概述,什么是博弈？拍卖金钱海盗博弈田忌赛马围棋和象棋,上,中,下,中,上,下,赢，输,田忌,赢，输,赢，输,输，赢,赢，输,输，赢,输，赢,赢，输,赢，输,齐王,1、博弈主体（局中人、参与人players）主体是理性的经济人，力图实现自身利益最大化 2、游戏规则游戏顺序、游戏方法等 3、策略（strategy）个人在博弈中的行为选择降价、提价；打人、骂人、沉默使狙击还是AK；躲在角落还是进攻,一、博弈的基本要素,4、支付（收益 payoff）策略带来的结果：打人、

2、骂人、沉默 5、信息完全信息、不完全信息对方的收益状况、策略状况等对方是否知道我的信息 6、均衡（equilibrium) 均衡：所有参与人最优战略的组合,博弈论的定义 1、John C.Harsanyi在他1994年获得诺贝尔经济学奖的获奖辞中的定义：博弈论是关于策略相互作用的理论，就是说，它是关于社会形势中理性行为的理论，其中，每个局中人对自己行动的选择必须以他对其他局中人将如何反应的判断为基础。 2、张维迎的定义：博弈论是研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题。,1、分类的不同标准 A、主体：两人博弈、多人博弈（有单人博弈吗？） B、行动顺序：静态、

3、动态 C、信息情况：完全、不完全 D、支付情况：零和、常和、变和（蕴涵了双赢和多赢的可能） E、能否达成有约束力的协议:合作博弈、非合作博弈,二、博弈的分类,2、普遍采用的分类标准及其组合 A、行动顺序：静态、动态 B、信息情况：完全、不完全 C、四种基本组合：完全信息静态完全信息动态不完全信息静态不完全信息动态,第二节纳什均衡,一、博弈的均衡经济学的均衡，是当其他条件不改变时，当事人的行为也不改变并且是约束条件下能够使得当事人达到最好的一种状态。博弈均衡，是各自都考虑到自己对手的策略行动之后所做出的行动，这个行动组合就是博弈的均衡。即参与人在最大化各自的支付时所选取的策略组合

4、。,二、囚徒困境Prisoners Dilemma,Prisoner A,Confess,Dont Confess,Confess,Dont Confess,Prisoner B,Prisoners Dilemma,上策（dominant strategy）：无论对方做什么，对我来说这么做都是最好的。,无论对方如何选择，每个人的最优选择：坦白。所以，我们可以预测，结果将是（坦白，坦白）,个人理性与集体理性的冲突,“囚徒困境”表明个人理性与集体理性的冲突。这样的例子很多：寡头竞争，军备竞赛，公共产品的供给和搭便车行为，等等；许多的制度就是为解决“囚徒困境”而存在的；和尚挑水的故事,三、占

5、优均衡 (dominant-strategy equilibrium),一般来说，由于每个参与人的效用依赖于所有人的选择，因此每个人的最优选择（战略）也依赖于所有其他人的选择（战略）。但在上述例子中，一个人的最优选择并不依赖于他人的选择。这样的最优战略，被称为“占优战略”(dominant strategy)。由所有参与人的占优战略构成的战略组合被称为“占优均衡”。上策均衡：是一种非常稳定的均衡。,占优均衡 (dominant-strategy equilibrium),占优战略均衡的出现只要求所有人都是理性的，但不要求每个参与人知道其他参与人是否理性。囚徒困境博弈有占优均衡，所以其结果很

6、容易预测。,夫妻争斗博弈,丈夫,妻子,动口,动手,动口,动手,0.5，1, 1 ，1, 1.5 ，1,0， 0,有些博弈没有占优均衡，但通过剔除“坏”战略，我们可以预测博弈的结果。如“智猪博弈”,按,等待,按,等待,3，1,2，4,7，1,0，0,“劣”战略：无论对方选择什么，如果自己选择A得到的总是收益小于选择B得到的收益，A就是相对于B的劣战略。,大猪,小猪,四、纳什均衡,1、纳什均衡的定义：设是n人博弈G ；的一个策略组合。如果对于每个局中人，对于所有都成立，则我们称策略组合是该博弈的一个纳什均衡。,如果用表示除之外的所有参与人，则上述定义可以简化为：设是n人博弈G

7、；的一个策略组合。如果对于每个局中人，对于所有都成立，则我们称策略组合是该博弈的一个纳什均衡。,纳什简介：约翰纳什生于1928年6月13日。父亲是电子工程师与教师，第一次世界大战的老兵。纳什小时孤独内向。纳什的数学天分大约在14岁开始展现。他在普林斯顿大学读博士时刚刚二十出头，但他的一篇关于非合作博弈的博士论文和其他相关文章，确立了他博弈论大师的地位。在20世纪50年代末，他已是闻名世界的科学家了。然而，30岁的时候，纳什和他惟一儿子都罹患精神分裂症。半个世纪之后，在他妻子（艾利西亚麻省理工学院物理系毕业生）的精心照料下，和她的儿子一样，纳什教授渐渐康复，并在1994年获得诺贝

8、尔经济学奖。影片美丽心灵是一部以纳什的生平经历为基础而创作的人物传记片。该片荣获2002年奥斯卡金像奖。,纳什均衡：举例,广告博弈这是否是一个囚徒困境？,企业1,企业2,摊位博弈,1、两个摆摊的，请问他们各自应该在哪点摆摊？ 2、类似的问题还包括：加油站或者加气站的选址总统竞选,占优策略,Dominant Strategies “Im doing the best I can no matter what you do.” “Youre doing the best you can no matter what I do.”,纳什均衡,Nash Equilibrium “Im doin

9、g the best I can given what you are doing” “Youre doing the best you can given what I am doing.”,陈屹立,Kobe Bryant,上,下,下,上,10，10,5，5,10，10,5，5,篮球博弈,交通博弈与交通规则,靠左行,靠右行,靠左行,靠右行,1，1,1，1,-1，-1,-1，-1,2、多重纳什均衡,法律和社会规范如何协调预期,法律和社会规范就是这种协调预期的规则，帮助人们在多个纳什均衡中筛选一个特定的纳什均衡。社会规范是通过习惯、长期的交互博弈产生的行为规则，法律是立法机关制定的行为规则，但不

10、论是法律还是社会规范，它们的功能之一都是协调预期。,交通规则的演变,在多个纳什均衡之间不存在优劣之分时，偶然事件对选择具有重要意义；从历史上来考察，许多交通规则一开始并不体现为法律，而是长期演化而来的。在欧洲大陆的早期，道路行走规范是非常地方化的，有些地方采用靠左走的习惯，有些地方采用靠右走的习惯，是不统一的。只是随着道路的增加和地区间交往的扩大，地方性的习惯才逐步演变为区域性的规范，然后有演变为全国性的规范。但直到世纪前，道路规则也仅仅是作为规范而得到遵守，而不是作为交通法律而得到执行。现在欧洲大陆的靠右走的规则是在法国兴起的。,交通规则的演变,在法国大革命以前，贵族的马车习惯上是靠左行

11、的，穷人在路上看到富人的马车来了，要站在马路的右边。因此，靠左行与“特权阶级”相联系，而靠右行被认为更为“民主”。随着法国大革命，作为一个革命的象征，规定所有的车都要靠右走。随着拿破仑对欧洲大陆的征服，拿破仑将法国的规则带给了欧洲，也包括靠右行驶的规则。在地域上这个规则的转变也是从西到东逐步完成的。比如说，与靠右行的西班牙接壤的葡萄牙是在一战之后才转为靠右行，奥地利是从西到东一个省一个省逐步转变的，匈牙利、捷克和德国是在二战前才由左行转向右行的。瑞典，一直到1967年，才通过法律宣布从靠左行改为靠右行。,3、聚点均衡,在多重纳什均衡的博弈中，局中人同时选择一个聚点，在该聚点上达成共识。据此确

12、定的纳什均衡称为聚点均衡。在现实生活中，局中人可能会使用某些被博弈模型抽象掉的信息来达成一个共识，从而达到一个均衡。这些信息往往跟社会文化习惯、局中人过去博弈的历史和经历有关，因而很难总结出普遍规律，只能具体问题具体分析。这就是聚点均衡概念的基本思想。,案例：假定你和你热恋中的恋人正在打电话，突然，连接中断。这时候，你将如何行动？聚点是什么？,重打男不打,女重打不打,情侣博弈,女生篮球舞蹈,篮球男生舞蹈,纳什均衡的一致预测性如果所有博弈方都预测一个特定的博弈结果会出现，那么所有的博弈方都不会选择与预测结果不一致的策略，即：没有哪个博弈方有偏离这个预测结果的愿望，因此这个预

13、测结果最终真会成为博弈的结果。从而，纳什均衡是稳定的和自我实施的（Self-enforcing）。作为法律，如果对当事人来说构成纳什均衡，那么法律的执行将不需要正式机构的强制执行。比如：行车的时候都靠右边就是一个纳什均衡,4、纳什均衡与自我执行,5、古诺（Cournot）模型,纳什均衡在连续策略博弈中的运用,基本模型,两家寡头在同种类在市场上竞争。假设市场需求曲线为 P = Q，为正常数。而Q = Q1 + Q2是公司1和公司2生产的总量。为简化分析，假设两个企业的边际成本总是为C。给定企业2的产量为Q2时，企业1的利润最大化产量为： Q1 =R1(Q2) 类似的，给定企业1的产量为

14、Q1时，企业2的利润最大化产量为： Q2 =R2(Q1),为做出该决策，每家公司必须采取两步： 1. 对另一家公司的生产量进行预测。这一步将给于公司一个有关可能的市场价格的想法；例如，如果它认为对手将生产大量产品，那么，不管它自己生产多少，价格将偏低。 2.决定自己的生产数量。为做出这个决定，公司必须权衡从增加产量得到的好处以及这样做所需要的成本当两家公司满意地解决了这两件事时，将得到纳什均衡。,企业1的边际收益MR1为：企业2的边际收益MR2为：,令两个企业的MR=MC=C，得到各自最大化利润的产量为：我们称上面两个式子分别为各自的反应函数。,注意到，图像存在唯一的交点，相应的一对Q值

15、就是该博弈的纳什均衡，请自己计算出均衡产量、均衡价格和均衡利润。,Q1*,Q2*,第三节序贯博弈与重复博弈,一、序贯博弈（sequential game）博弈者的行动是有先后顺序的，一个先行动，然后另外一个做出反应。,女,篮球,篮球,舞蹈,舞蹈,篮球,动态的情侣博弈,男,女,舞蹈,（2，1）,（0，0）,（1，1）,（1，2）,博弈树,男,篮球,篮球,舞蹈,舞蹈,篮球,动态的情侣博弈：女先行动,女,男,舞蹈,（1，2）,（ 1 ，1 ）,（0，0）,（2，1）,垄断者,容忍,抵抗,进入,进入博弈,进入者,垄断者,不进,（1，5）,（2，2）,（0，10）,二、重复博弈(repeated g

16、ame),1、什么是重复博弈？给定一个静态博弈G，重复进行T次G，并且在每次重复G之前，各博弈方都能观察到以前博弈的结果。这样的博弈过程称为“G的T次重复博弈” 几点注意：每次博弈是完全相同的（参与人、战略、信息、支付等）；参与人能够观察到博弈过去的历史,分类（主要根据重复次数分类）：（1）有限重复博弈；（2）无限重复博弈；（3）有限但重复次数不确定博弈。同一个博弈，反复进行。,囚徒困境博弈,合作,不合作,合作,不合作,3，3,-1，4,4，-1,0，0,A,B,重复博弈与战略空间的扩展,假定上属博弈重复多次或无限次；那么，每个参与人有多个可以选择的战略：仅举几例：不论过去什么发

17、生，总是选择不合作；不论过去什么发生，总是选择合作；从合作开始，之后每次选择对方前一阶段的行动（即对方合作我合作，对方不合作我不合作）；人不犯我，我不犯人；人若犯我，我必犯人！从合作开始，一直到对方不合作，然后永远选择不合作（报复！）。,重复博弈和信誉问题,如果博弈不是一次的，而是重复进行的，参与人过去行动的历史是可以观察到的，参与人就可以将自己的选择依赖于其他人之前的行动，因而有了更多的战略可以选择，均衡结果可能与一次博弈大不相同。重复博弈理论的最大贡献是对人们之间的合作行为提供了理性解释；在囚徒困境中，一次博弈的唯一均衡是不合作（即坦白）。但如果博弈无限重复，合作就可能出现。人

18、们为了获得长期利益而愿意合作，这远远大于短期机会主义行为带来的短期收益。,例子,一锤子买卖乡土社会中的合作和信誉机制淘宝网卖家衣冠楚楚和贼眉鼠眼,第四节进入威慑,一、承诺、威胁及其可信度在一个博弈中，需要威胁别人使得对方采取对自己有利的战略，那么威慑有时候是很重要的，但是威胁必须是可信的。,举例：如果1承诺不选择U,1,2,1,（2，0）,（5，0）,（4，2）,（1，1）,U,D,R,L,U,D,厂商1的承诺： 1、不可置信 2、转化为可置信承诺：签订合约，违约赔偿为2,定价博弈,Firm 1,High Price,Low Price,High Price,Low Price,Fi

19、rm 2,定价博弈,Firm 1,High Price,Low Price,High Price,Low Price,Firm 2,问题企业1可以通过威胁说制定低价来迫使企业2制定高价吗?,承诺,承诺是将不可置信的威胁变成可置信的威胁的行动承诺意味着限制自己的自由：选择少反而对自己好如“破釜沉舟”的故事,承诺举例,婚姻中的承诺：彩礼、昂贵的婚礼可以理解为一种对婚姻的承诺；口头的“我永远爱你”和如果不对你好，则一辈子不再结婚或恋爱订/定金、抵押物做为对交易的承诺； “安营扎寨”；再不按轮次扫寝室老大就收拾你人！,二、先动优势,连锁店进入博弈,沃尔玛,进入,不进入,进入,不进入,公司

20、X,连锁店进入博弈,两个纳什均衡上右下左先行动者占优,先动优势与后动优势,在动态博弈中，行动总有先后顺序。有些博弈具有先动优势(first-mover advantage),但有些博弈具有后动优势(second-mover advantage). 让产量竞争具有先动优势，而价格竞争可能是后动优势；开会发言？在不完全信息下，顺序更重要。但有些博弈既没有先动优势，也没有后动优势，如抓阄。,二、威胁进入,1、价格策略为了阻止新的厂商进入而分享你的市场，那么你所采取的策略必须使得对手进入之后是无利可图的。,在位者,进入,不进入,高价格,低价格,潜在进入者,本博弈的均衡是什么？,在位者的低

21、价威胁是否可信？,在位者高价是其上策！,如何改变上面的博弈格局？,2、价格报复价格报复是当进入马上发生或者实际发生之际采用的一种措施。一旦进入威胁消失企业再恢复高价。,在位者,进入,不进入,高价格,低价格,潜在进入者,我就一直少赚点，一期少赚30，但是一旦我让你退出之后我高价则一下比现在多出130，企业完全可以采取低价报复的策略！,让对方的预期改变：我就是与众不同，让人不可捉摸，我是非理性的！敢跟我斗的人我一定让他血本无归！,3、扩大产能（投资）,在位者,进入,不进入,小厂,大厂,潜在进入者,拉斯缪森：博弈与信息，北京大学出版社、上海三联书店2003 拜尔、格特纳、皮克：法律的博弈分析，法律出版社1999 张维迎：博弈论与信息经济学，上海三联出版社,

展开阅读全文