博弈论69976.ppt_三一文库31doc.com

资源描述

《博弈论69976.ppt》由会员分享，可在线阅读，更多相关《博弈论69976.ppt（48页珍藏版）》请在三一文库上搜索。

1、博弈的划分,博弈的划分：从参与人行动的先后顺序：静态博弈和动态博弈静态博弈：参与人同时选择行动或非同时行动但后行动者并不知道前行动者采取了什么具体行动；动态博弈：参与人行动有先后顺序，且后行动者能够观察先行动者选择的行动。,博弈的划分,参与人对其他参与人（对手）的特征、战略空间及支付函数的知识：完全信息博弈和不完全信息博弈。完全信息：每一个参与人对所有其他参与人的（对手）的特征、战略空间及支付函数有准确的知识，否则为不完全信息。,博弈的划分：,完全信息静态博弈的特点？,占优均衡 DSE,重复剔除占优均衡 IEDE,纯战略纳什均衡 PNE,混合战略纳什均衡 MNE,第三章完全信息动态

2、博弈 -子博弈精炼纳什均衡,一博弈扩展式表述二子博弈精练纳什均衡三应用举例,一博弈扩展式表述,博弈的扩展式表述包括三个要素: 参与人集合每个参与人的战略集合由战略组合决定的每个参与人的支付,进入者,进入,不进入（0，300）,在位者,市场进入阻挠博弈树,不可置信威胁,合作（40，50）,斗争（-10，0）,博弈的战略表述,案例- 房地产开发项目-假设有A、B两家开发商市场需求：可能大，也可能小投入：1亿,假定市场上有两栋楼出售：需求大时，每栋售价1.4亿，需求小时，售价7千万；如果市场上只有一栋楼需求大时，可卖1.8亿需求小时，可卖1.1亿,博弈战略表述,不开发,

3、开发商A,开发,不开发,开发,不开发,开发商B,开发商A,开发,不开发,开发,开发商B,需求小的情况,需求大的情况,博弈的战略式表述,A,开发,不开发,N,N,大,小,1/2,1/2,大,小,1/2,1/2,B,B,B,B,开发,不开发,开发,不开发,开发,不开发,开发,不开发,(4,4),(8,0),(-3,-3),(1,0),(0,8),(0,0),(0,1),(0,0),参与人集合参与人行动顺序参与人的行动空间参与人的信息集参与人的支付函数外生事件的概率分布,房地产开发博弈,一博弈扩展式表述,博弈的基本构造结: 包括决策结和终点结两类;决策结是参与人行动的始点,终点结是决策

4、人行动的终点. 结满足传递性和非对称性 x之前的所有结的集合，称为x的前列集P（x），x之后的所有结的集合称为x的后续集T（x）。枝: 枝是从一个决策结到它的直接后续结的连线,每一个枝代表参与人的一个行动选择. 信息集: 每个信息集是决策结集合的一个子集,A,开发,不开发,N,N,大,小,1/2,1/2,大,小,1/2,1/2,B,B,B,B,开发,不开发,开发,不开发,开发,不开发,开发,不开发,(4,4),(8,0),(-3,-3),(1,0),(0,8),(0,0),(0,1),(0,0),B在决策时不确切地知道自然的选择; B的决策结由4个变为2个,房地产开发博弈,A,开发,不开发,

5、N,N,大,小,1/2,1/2,大,小,1/2,1/2,B,B,B,B,开发,不开发,开发,不开发,开发,不开发,开发,不开发,(4,4),(8,0),(-3,-3),(1,0),(0,8),(0,0),(0,1),(0,0),B知道自然的选择;但不知道A的选择(或A、B同时决策),房地产开发博弈,一博弈扩展式表述,只包含一个决策结的信息集称为单结信息集，如果博弈树的所有信息都是单结的，该博弈称为完美信息博弈。不同的博弈树可以代表相同的博弈，但是有一个基本规则：一个参与人在决策之前知道的事情，必须出现在该参与人决策结之前。,二占优战略均衡,案例1-囚徒困境,囚徒A,囚徒 B,坦白,抵赖,

6、坦白,抵赖,A,B,坦白,抵赖,B,B,A,A,坦白,抵赖,坦白,抵赖,(-8,-8),(0，-10),(-10,0),(-1,-1),坦白,抵赖,坦白,抵赖,坦白,抵赖,(-8,-8),(0，-10),(-10,0),(-1,-1),囚徒困境博弈的扩展式表述,囚徒困境博弈的扩展式表述,智猪博弈的扩展式表述？,等待,小猪,大猪,按,等待,按,案例2-智猪博弈,第三章完全信息动态博弈 -子博弈精炼纳什均衡,一博弈扩展式表述二子博弈精练纳什均衡扩展式表述博弈的纳什均衡子博弈精练纳什均衡用逆向归纳法求子博弈精练纳什均衡承诺行动与子博弈精练纳什均衡逆向归纳法与子博弈精练纳什均衡的存在

7、问题三应用举例,战略的表述,战略：参与人在给定信息集的情况下选择行动的规则，它规定参与人在什么情况下选择什么行动，是参与人的“相机行动方案”。,在静态博弈中，战略和行动是相同的。作为一种行动规则，战略必须是完备的。,完全信息动态博弈-子博弈精练纳什均衡泽尔腾（1965）,考虑下列问题：一个博弈可能有多个（甚至无穷多个）纳什均衡，究竟哪个更合理？纳什均衡假定每一个参与人在选择自己的最优战略时假定所有其他参与人的战略是给定的，但是如果参与人的行动有先有后，后行动者的选择空间依赖于前行动者的选择，前行动者在选择时不可能不考虑自己的行动对后行动者的影响。子博弈精练纳什均衡的一个重要改进是将

8、“合理纳什均衡”与“不合理纳什均衡”分开。,一、博弈的基本概念及战略表述,不开发,开发商A,开发,不开发,开发,不开发,开发商B,开发商A,开发,不开发,开发,开发商B,需求小的情况,需求大的情况,博弈的战略式表述,扩展式,纳什均衡与均衡结果：存在三个纯战略纳什均衡： (不开发，（开发，开发），（开发，（不开发，开发），（开发,（不开发，不开发）两个均衡结果：（开发，不开发）（不开发，开发）注意：均衡不同于均衡结果,到底哪一个均衡结果将最终出现？,扩展式表述博弈的纳什均衡,若A先行动，B在知道A的行动后行动，则A有一个信息集，两个可选择的行动，战略空间为:(开发，不开发）； B有两

9、个信息集，四个可选择的行动，B有四个纯战略：开发策略：不论A开发不开发，我开发；追随策略：A开发我开发，A不开发我不开发；对抗策略：A开发我不开发，A不开发我开发；不开发策略不论A开发不开发我不开发，简写为：（开发，开发），（开发，不开发），（不开发，开发），（不开发，不开发），括号内的第一个元素对应A选择“开发”时B的选择，第二个元素对应A选择“不开发”时B的选择。,什么是参与人的战略？,扩展式表述博弈的纳什均衡,足球,男的策略：足球，芭蕾选择足球；还是选择芭蕾。女的策略：（足球，芭蕾），（芭蕾，足球）（芭蕾，芭蕾），（足球，足球） 1、追随策略：他选择什么，我就选择什

10、么 2、对抗策略：他选择什么，我就偏不选什么 3、芭蕾策略：不管他选什么，我都选芭蕾； 4、足球策略：不管他选什么，我都选足球。,策略即：如果他选择什么，我就怎样行动的相机行动方案。在扩展式博弈里，参与人是相机行事，即“等待”博弈到达一个自己的信息集（包含一个或多个决策结后，再采取行动方案。,什么是动态博弈？,扩展式,开发,开发,开发,不开发,不开发, 开发,不开发,不开发,开发,不开发,开发商B,开发商A,战略式,开发,(开发,不开发),纳什均衡与均衡结果：存在三个纯战略纳什均衡： (不开发，（开发，开发），（开发，（不开发，开发），（开发,（不开发，不开发）两个均衡结果：（开发，不开

11、发）（不开发，开发）注意：均衡不同于均衡结果,完全信息动态博弈-子博弈精练纳什均衡泽尔腾（1965）,泽尔腾引入子博弈精练纳什均衡的概念的目的是将那些不可置信威胁战略的纳什均衡从均衡中剔除，从而给出动态博弈的一个合理的预测结果，简单说，子博弈精练纳什均衡要求均衡战略的行为规则在每一个信息集上是最优的。,第三章完全信息动态博弈 -子博弈精炼纳什均衡,一博弈扩展式表述二子博弈精练纳什均衡扩展式表述博弈的纳什均衡子博弈精练纳什均衡用逆向归纳法求子博弈精练纳什均衡承诺行动与子博弈精练纳什均衡逆向归纳法与子博弈精练纳什均衡的存在问题三应用举例,扩展式,开发,开发,开发,不开发,

12、不开发, 开发,不开发,不开发,开发,不开发,开发商B,开发商A,战略式,开发,(开发,不开发),路径在扩展式博弈中，所有n个参与人的一个纯战略组合决定了博弈树上的一个路径。（开发，不开发，开发）决定了博弈的路径为A开发B不开发-（1，0）（不开发，开发，开发）决定了路径：？,第三章完全信息动态博弈 -子博弈精炼纳什均衡,一博弈扩展式表述二子博弈精练纳什均衡扩展式表述博弈的纳什均衡子博弈精练纳什均衡用逆向归纳法求子博弈精练纳什均衡承诺行动与子博弈精练纳什均衡逆向归纳法与子博弈精练纳什均衡的存在问题三应用举例,子博弈精炼纳什均衡,泽尔腾引入子博弈精练纳什均衡的概念的目

13、的是将那些不可置信威胁战略的纳什均衡从均衡中剔除，从而给出动态博弈的一个合理的预测结果，简单说，子博弈精练纳什均衡要求均衡战略的行为规则在每一个信息集上是最优的。,子博弈精炼纳什均衡-不可置信威胁,美国普林斯顿大学古尔教授在1997年的经济学透视里发表文章，提出一个例子说明威胁的可信性问题：两兄弟老是为玩具吵架，哥哥老是要抢弟弟的玩具，不耐烦的父亲宣布政策：好好去玩，不要吵我，不管你们谁向我告状，我都把你们两个关起来，关起来比没有玩具更可怕。现在，哥哥又把弟弟的玩具抢去玩了，弟弟没有办法，只好说：快把玩具还我，不然我就要去告诉爸爸。哥哥想，你真要告诉爸爸，我是要倒霉的，可是你不告状不过没有玩

14、具玩，而告了状却要被关禁闭，告状会使你的境遇变得更坏，所以你不会告状，因此哥哥对弟弟的警告置之不理。的确，如果弟弟是会算计自己利益的理性人，在这样的环境下，还是不告状的好。可见，弟弟是理性人，他的告状威胁是不可置信的。,扩展式,纳什均衡与均衡结果：存在三个纯战略纳什均衡： (不开发，（开发，开发），（开发，（不开发，开发），（开发,（不开发，不开发）两个均衡结果：（开发，不开发）（不开发，开发）注意：均衡不同于均衡结果,到底哪一个均衡结果将最终出现？,子博弈精练纳什均衡,A,开发,不开发,B,B,开发,不开发,开发,(-3,-3),(1，0),（0，1),(0,0),不开发,(不开

15、发，（开发，开发），（开发，（不开发，开发），（开发,（不开发，不开发）,如果A选择开发，B的最优选择是不开发，如果A选择不开发，B的最优选择是开发，A预测到自己的选择对B的影响，因此开发是A的最优选择。子博弈精练纳什均衡结果是：A选择开发，B选择不开发。,x,x,对于(不开发，（开发，开发），这个组合之所以构成纳什均衡，是因为B威胁不论A开发还是不开发，他都将选择开发，A相信了B的威胁，不开发是最优选择，但是A为什么要相信B的威胁呢？毕竟，如果A真开发，B选择开发得-3，不开发得0，所以B的最优选择是不开发。如果A知道B是理性的，A将选择开发，逼迫B选择不开发。自己得1，B得0，即纳什均衡

16、(不开发，（开发，开发）是不可置信的。因为它依赖于B的一个不可置信的威胁。同样：（不开发，不开发）也是一个不可置信威胁，纳什均衡（开发,（不开发，不开发）是不合理的。,子博弈精练纳什均衡,泽尔腾引入子博弈精练纳什均衡的概念的目的是将那些不可置信威胁战略的纳什均衡从均衡中剔除，从而给出动态博弈的一个合理的预测结果，简单说，子博弈精练纳什均衡要求均衡战略的行为规则在每一个信息集上是最优的。什么是子博弈，什么是子博弈精练纳什均衡？有没有更好的方法找到子博弈精练纳什均衡？,完全信息动态博弈-子博弈精练纳什均衡泽尔腾（1965）,子博弈：是原博弈的一部分，它本身也可以作为一个独立的博弈进行分析：

17、（1）子博弈必须从一个单结信息点开始：只有决策者在原博弈中确切地知道博弈进入一个特定的决策结时，该决策结才能作为一个子博弈的初始结。如果信息集包含两个以上的决策结，则这两个都不可以作为子博弈的初始结（见下页）。（2）子博弈的信息集和支付向量都直接继承自原博弈，即当x和x在原博弈中属于同一信息集时，他们在子博弈中才属于同一信息集。习惯上，任何博弈的本身称为自身的一个子博弈。,完全信息动态博弈-子博弈精练纳什均衡泽尔腾（1965）,不开发,不开发,房地产开发博弈,找出房地产开发博弈的子博弈,(不开发，（开发，开发），（开发，（不开发，开发），（开发,（不开发，不开发）,A,开发,不开发,X,

18、X,大,小,1/2,1/2,大,小,1/2,1/2,B,B,B,B,开发,不开发,开发,不开发,开发,不开发,开发,不开发,(4,4),(8,0),(-3,-3),(1,0),(0,8),(0,0),(0,1),(0,0),参与人X的信息集不能开始一个子博弈，否则的话，参与人B的信息将被切割。,完全信息动态博弈-子博弈精练纳什均衡泽尔腾（1965）,子博弈精练纳什均衡：扩展式博弈的战略组合是一个子博弈精练纳什均衡，如果: （1）它是原博弈的纳什均衡；（2）它在每一个子博弈上给出纳什均衡。,A,开发,不开发,B,B,开发,不开发,开发,(1，0),（0，1),(0,0),(-3,-3),x,

19、x,房地产开发博弈,(不开发，（开发，开发），（开发，（不开发，开发），（开发，（不开发，不开发）在c上构成均衡，在b上不构成；在b和c上都构成在c上构成均衡，在b上不构成,完全信息动态博弈-子博弈精练纳什均衡泽尔腾（1965）,不开发,判断下列均衡结果哪个构成子博弈精练纳什均衡？,不开发,b,c,完全信息动态博弈-子博弈精练纳什均衡泽尔腾（1965）,如果一个博弈有几个子博弈，一个特定的纳什均衡决定了原博弈树上唯一的一条路径，这条路径称为“均衡路径”，博弈树上的其他路径称为“非均衡路径”。纳什均衡只要求均衡战略在均衡路径的决策结上是最优的；而构成子博弈精练纳什均衡不仅要求在均衡路径

20、上策略是最优的，而且在非均衡路径上的决策结上也是最优的。这是纳什均衡与子博弈精练纳什均衡的实质区别。,完全信息动态博弈-子博弈精练纳什均衡泽尔腾（1965）,战略是参与人行动规则的完备描述，它要告诉参与人在每一种可预见的情况下（即每一个决策结）上选择什么行动，即使这种情况实际上没有发生（甚至参与人并不预期它会发生）。因此，只有当一个战略规定的行动规则在所有可能的情况下都是最优的，它才是一个合理的可置信的战略，子博弈精练纳什均衡就是要剔除那些只在特定情况下是合理的而在其他情况下不合理的行动规则。,第三章完全信息动态博弈 -子博弈精炼纳什均衡,一博弈扩展式表述二子博弈精练纳什均衡扩展式

21、表述博弈的纳什均衡子博弈精练纳什均衡用逆向归纳法求子博弈精练纳什均衡承诺行动与子博弈精练纳什均衡逆向归纳法与子博弈精练纳什均衡的存在问题三应用举例,用逆向归纳法求-子博弈精练纳什均衡,1,U,D,L,（3，1),(0,0),2,(2，2),R,给定博弈达到最后一个决策结，该决策结上行动的参与人有一个最优选择，这个最优选择即该决策结开始的子博弈的纳什均衡倒数第二个决策结，找倒数第二个的最优选择，这个最优选择与我们在第一步找到的最优选择构成一个纳什均衡。,如此重复直到初始结。每一步都得到对应于子博弈的一个纳什均衡，并且根据定义，该纳什均衡一定是该子博弈的子博弈的纳什均衡，这个过程的最

22、后一步得到整个博弈的纳什均衡,完全信息动态博弈-子博弈精练纳什均衡泽尔腾（1965）,用逆向归纳法求子博弈精练纳什均衡对于有限完美信息博弈，逆向归纳法求解子博弈精练纳什均衡是一个最简便的方法。,房地产开发博弈,完全信息动态博弈-子博弈精练纳什均衡泽尔腾（1965）,1,U,D,L,（1，1),2,2，0,R,U,（3，0),(0,2),1,D,子博弈精练纳什均衡（U，U），L）. U和L分别是参与人1和参与人2在非均衡路径上的选择。逆向归纳法求解子博弈精练纳什均衡的过程，实质上是重复剔除劣战略的过程：从最后一个决策结依次剔除每个子博弈的劣战略，最后生存下来的战略构成精练纳什均衡。,完全信息

23、动态博弈-子博弈精练纳什均衡泽尔腾（1965）,用逆向归纳法求解的子博弈精练纳什均衡也要求“所有的参与人是理性的”是共同知识。如果博弈由多个阶段组成，则从逆向归纳法得到的均衡可能并不非常令人信服。,完全信息动态博弈-子博弈精练纳什均衡泽尔腾（1965）,进入者,进入,不进入（0，300）,在位者,市场进入阻挠博弈树,不可置信威胁,支付函数,行动,合作（40，50）,斗争（-10，0）,练习,强盗分赃（向前展望，倒后推理）有5个强盗抢得10枚硬币，在如何分赃上争论不休，于是他们决定：（1）抽签决定个人的号码（1，2，3，4，5）（2）由1号提出分配方案，然后5人表决，如果方案超过半数同于就通过，否则他被扔进大海喂鲨鱼；（3）1号死后，2号提方案，4人表决，当且仅当超过半数同意时方案通过，否则2号被扔进大海；（4）依次类推，知道找到一个每个人都接受的方案（当然，如果只剩5号，他独吞）结果会如何？,作业,

展开阅读全文