第五章动态博弈与承诺.ppt

资源描述

《第五章动态博弈与承诺.ppt》由会员分享，可在线阅读，更多相关《第五章动态博弈与承诺.ppt（59页珍藏版）》请在三一文库上搜索。

1、动态博弈与承诺第五章 1 动态博弈行动有先后顺序，不同的参与人在不同时点行动，先行动者的选择影响后行动者的选择空间，后行动者可以观察到先行动者做了什么选择。如下棋 2 静态博弈和动态博弈区别静态博弈经常是一次性的行为，决策一旦作出就不能再更改结果。动态博弈有一个重复的性质，前边的所有信息影响到后边的决策，博弈的结果要经过多次博弈之后才能看到，所以是一个连续的过程。如为人处世；连续 3 阶段(Stage)：动态博弈中一个博弈方的一次选择行为。动态博弈的阶段和扩展性表示 A B B A 不制止制止（-2，5）（2，2）（10，4）（5，5）不仿冒（0，

2、10）仿冒不制止制止仿冒不仿冒一个动态博弈至少有两个阶段，因此动态博弈有时也称为“多阶段博弈” (Multistage Games)或序列博弈(Sequential Games)，这是由动态博弈中的次序特征引出来的。 4 子博弈（subgame) 由原博弈中某个决策点（信息集）开始的部分构成一个子博弈。分乙甲不借借不分（1，0）（0，4）（2，2）乙（-1，0） 5 动态博弈中的战略战略是一个完备的行动计划：在博弈开始之前就规定出每一个决策点上的选择，即使这个决策点实际上不会出现。考虑老师与学生之间考试之后的一个博弈：老师先行动（判分），

3、学生后行动（在不同分数下如何应对）。假定学生的实际成绩是不及格。 6 接受老师学生学生及格不及格报复报复接受 (-10,-10) (-1, 1) (-10, -10) (1, -1) 考试博弈 7 战略表式下的纳什均衡及格不及格老师学生 A，FF，AA，AF，F -1，1-10，-10-1，1 -10，-10 -10，-10 1，-1 1，-1-10，-10 8 不可置信的威胁(noncredible threat) 在（及格；A，F）和（不及格；F，A）中，学生“报复（F）”的威胁是不可信的：无论老师判“及格”还是“ 不及格”，“报复”不是学生的最优选择；事前（

4、ex ante)和事后(ex post)：一种战略所规定的行动在事前看来是最优的，但事后看并不是当事人的最优选择，这种行动就不可置信，该战略就不是一个合理的战略。 9 相机选择和策略中的可信性问题不同版本的开金矿博弈分钱和打官司的可信性乙甲（0，4）（2，2）（1，0）不借借分不分开金矿博弈不借乙甲乙借不分分（1，0）不打打（0，4）（1，0）（2，2）有法律保障的开金矿博弈分钱打官司都可信 10 相机选择和策略中的可信性问题不同版本的开金矿博弈分钱和打官司的可信性乙甲乙打（2，2）不分分不借借（0，4）（-1，

5、0）不打（1，0）法律保障不足的开金矿博弈分钱打官司都不可信 11 精炼纳什均衡（perfect NE) 不包含不可置信的行动的战略所组成的纳什均衡被称为 “精炼纳什均衡”；也就是说，不论过去发生了什么，构成精炼纳什均衡的战略，其所规定的行动在每一个决策点上都是最优的。所以，又称为“序惯均衡 ”(sequential equilibrium); 序贯理性要求，不论过去发生了，参与人将选择最优的行动。首先必须是“纳什均衡”，但并非所有纳什均衡都是合理的；只有其战略不包含不可置信行动的纳什均衡才是合理的。 12 子博弈精炼纳什均衡泽尔腾（1965年）提出了“子博弈完美纳什均

6、衡”（Subgame Perfect Nash Equilibrium) SPE满足条件：在原博弈是一个纳什均衡；在每一个子博弈上都是纳什均衡。 REINHARD SELTEN (1930-) 13 逆向归纳法(backward induction) 从最后一个决策点开始，找出该子博弈的纳什均衡；然后再倒回到倒数第二个决策点，找出决策者的最优决策（假定最后一个决策者的决策是最优的) ；如此一直到初始决策点，所有子博弈上的最优选择就是精炼纳什均衡。又称“rollback”. 即从最后一个阶段往回推理，剔除“坏”选择，直到找到唯一的结果。 14 举例 1 2 1 （2，0）（5，0）

7、（4，2）（1，1） U DR L U D （2，0） 15 均衡路径与非均衡路径精炼纳什均衡下所经过的决策点和最优选择构成的路径，称为均衡路径（equilibrium path) ；其他的路径是非均衡路径（off-equilibrium path)； 16 精炼均衡与理性共识逆向归纳的过程实际上就是重复剔除劣战略的过程，其前提是博弈规则和理性共识：每个人是理性的，每个人知道每个人是理性的，如此等等。因此，精炼纳什均衡的合理性取决于理性共识的合理性。 17 不可置信威胁举例精炼纳什均衡剔除了不可置信的威胁，使得我们可以更合理地对博弈中参与人行为的预测；不可置信威胁的

8、根源是事前最优与事后最优不同，导致许多帕累托效率无法实现；管教孩子为什么困难？大企业为什么效率低？（TBTF） 18 现实生活中的例子不伤心女儿父母跳楼断绝关系嫁张三 19 承诺（Commitment) 承诺是将不可置信的威胁变成可置信的威胁的行动：威胁不仅事前是最优的，事后也是最优的。承诺意味着限制自己的自由：选择少反而对自己好。占岛断桥如“破釜沉舟”的故事。 20 生产的选择白酒企业啤酒企业（10，100）（100，10）（1000，1000）不上啤酒上啤酒不扩大扩大 21 启迪现实生活中，企业通常是要保守商业秘密，但是有时又要故意泄露商

9、业秘密，这种故意泄露出来的商业秘密就可以看作是一种承诺。 22 承诺举例婚姻中的承诺：彩礼、昂贵的婚礼可以理解为一种对婚姻的承诺；订金、抵押物做为对交易的承诺；固定资产投资可以作为承诺；所有权的承诺作用； 23 作为承诺的法律法律改变事后的选择空间或选择成本，所以可以起到承诺的作用；刑法：为什么不能商量？为什么对严重犯罪要执行死刑？ “法治”(rule of law)是政府的承诺； 24 最惠条款 The “Most-favored-Customer” Clause 生产耐用品的企业经常被“降价预期”所困扰：如果消费者预期企业将降价，他们将会等待，结果企业只能降价。如

10、汽车行业面临的问题；最惠条款可以起到承诺的作用：企业不会降价了。 25 例子产量价格收入 1 2 3 4 100 80 40 30 100 160 120 120 假定企业一开始定价80，如果前两个消费者购买了，企业将有积极性在40的价格下向第三个顾客出售。预期到这一点，前两个顾客将不会购买。如果企业向顾客保证，任何降价的差额将返还顾客，前两个顾客将会购买。因为企业事实上不会降价了。 26 最惠条款对谁有利？ 10， 101， 14 14，15，5 不降降价不降降价不实行“最惠客待遇” 公司 2 公司 1 27 最惠条款对谁有利？ 10， 101， 9

11、 9，15，5 不降降价不降降价实行“最惠客待遇” 公司 2 公司 1 28 承诺的特点承诺不是空话，需要投资，花费代价。承诺无法反悔。承诺可以达到默契同谋的目的。承诺是动态博弈里经常采用的手段。 29 先动优势与后动优势先动优势(first-mover advantage)，是指一步领先，步步领先的“马太效应”。后动优势(second-mover advantage)，是指可以在前人发展的基础上发展，而不必付出探索的成本和代价。两句似乎矛盾的成语：先发制人和后发制人。 30 强盗分金 5个强盗抢得100枚金币，他们决定：抽签决定各人的号码（1、2、3、4

12、、5）； 1号提出分配方案，然后5人表决，当超过半数同意时，方案通过，否则1号将被扔入大海喂鲨鱼； 1号死后，2号提出方案，4人表决，当超过半数同意时，方案通过，否则，2号同样被扔入大海；以此类推 31 强盗分金假设每个强盗都是经济学假设的“理性人 ”，都能很理智地判断得失，作出选择，为了避免不必要的争执，我们还假定每个判决都能顺利执行。那么，如果你是第一个强盗，你该如何提出分配方案才能够使自己的收益最大化？ 32 出乎意料的答案许多人公认的标准答案是：1号强盗分给 3号1枚金币，4号或5号强盗2枚，独得97 枚。分配方案可写成（97,0，1,2，0）或（97,0，1,0，

13、2）。 33 启示在“强盗分金”模型中，任何“分配者”想让自己的方案获得通过的关键是事先考虑清楚“挑战者”的分配方案是什么，并用最小的代价获取最大收益，拉拢“挑战者”分配方案中最不得意的人们。 34 应用在国际政治、经济中，各国地位是不平等的，存在着“先动”和“后动”的区别。 35 几个经典动态博弈模型寡占的斯塔克博格模型劳资博弈讨价还价博弈委托人代理人理论 36 斯塔克博格(Stackelberg)模型 37 斯塔克博格(Stackelberg)模型 38 斯塔克博格(Stackelberg)模型产量得益厂商1 3单位 4.5 厂商2 1.5单位 2.25 先动

14、优势 39 练习两个寡头企业进行价格竞争博弈，企业1 、2的利润函数如下： 40 问题两个企业同时决策的纯策略纳什均衡；企业1先决策的子博弈完美纳什均衡；企业2先决策的子博弈完美纳什均衡。 41 参考答案两个企业同时定价。根据两个企业的得益函数，导出各自的反应函数： 42 参考答案两个企业同时决策时的纳什均衡是：此时两个企业的利润： 43 参考答案企业先决策。根据逆推归纳法，先求企业的反应函数：代入企业的利润函数，得到： 44 参考答案再求企业的反应函数：因此企业先决策时的子博弈完美与两个企业同时定价时相同，利润也相同。这实际上是因为本博弈中后行为的企业的选择与先

15、行为的企业的选择无关。 45 参考答案企业先决策。根据逆推归纳法，先求企业的反应函数：代入企业的利润函数，得到： 46 参考答案再求企业的反应函数：再把该价格代入企业的反应函数，得： 47 参考答案此时企业的利润： 48 参考答案此时企业的利润： 49 劳资博弈先由工会决定工资率，再由厂商决定雇用多少劳动力 W L R L 0 厂商的反应函数 R(L) 斜率为W 50 劳资博弈 L W 0 工会的无差异曲线 51 一个简单的例子两个兄弟分一块冰激凌。哥哥先提出一个分割比例，弟弟可以接受或拒绝，接受则按哥哥的提议分割，若拒绝就自己提出一个比例。但这时候冰激凌已化得只剩1

16、/2 了。对弟弟提议的比例哥哥也可以选择接受或拒绝，若接受则按弟弟的提议分割，若拒绝冰激凌会全部化光。因为兄弟之间不应该做损人不利已的事，因此我们假设接受或拒绝利益相同时兄弟俩都会接受。求该博弈的子博弈完美纳什均衡。 52 扩展型表示哥哥不接受，出S 接受不接受，出S2 弟接受出S1 53 三回合讨价还价博弈 1 1 2 不接受，出S 接受不接受，出S2 接受出S1 强制力假设任一博弈方只要得益不小于下一回合自己出价时的得益，就愿意接受对方的出价 54 三回合讨价还价博弈结果的讨论 55 无限回合讨价还价 56 博弈论向自己出难题 Centipede 博弈 (1,

17、0)(0,2)(3,0)(0,4)(0,N-1) (N,0) (0,N+1) ABABBA 57 旅行者困境（Travelversdilemma) 两个旅行者旅行回来，提取行李的时候，发现托运的花瓶被摔坏，于是向航空公司索赔。航空公司知道花瓶的价格大约在八九十元浮动，但不知道确切价格。于是请两位旅客在100元以内自己写下花瓶价格，如果写的一样，公司将认为他们讲真话并赔偿，如果不一样，公司就论定写得低的旅客讲的是真话，并原则上照这个价格赔偿，但是对讲真话的旅客奖励2元，对讲假话的旅客罚款2元。 58 This is the last slide in Chapter F5. This is the last slide in Chapter F5. Chapter F5 59

展开阅读全文