第五章动态博弈与承诺.ppt

上传人:本田雅阁 文档编号:2560948 上传时间:2019-04-08 格式:PPT 页数:59 大小:825.51KB
返回 下载 相关 举报
第五章动态博弈与承诺.ppt_第1页
第1页 / 共59页
第五章动态博弈与承诺.ppt_第2页
第2页 / 共59页
第五章动态博弈与承诺.ppt_第3页
第3页 / 共59页
亲,该文档总共59页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

《第五章动态博弈与承诺.ppt》由会员分享,可在线阅读,更多相关《第五章动态博弈与承诺.ppt(59页珍藏版)》请在三一文库上搜索。

1、 动态博弈与承诺 第五章 1 动态博弈 行动有先后顺序,不同的参与人在不同时 点行动,先行动者的选择影响后行动者的 选择空间,后行动者可以观察到先行动者 做了什么选择。 如下棋 2 静态博弈和动态博弈区别 静态博弈经常是一次性的行为,决策一旦作 出就不能再更改结果。 动态博弈有一个重复的性质,前边的所有信 息影响到后边的决策,博弈的结果要经过多 次博弈之后才能看到,所以是一个连续的过 程。 如为人处世; 连续 3 阶段(Stage):动态博弈中一个博弈方的一次选择行为 。 动态博弈的阶段和扩展性表示 A B B A 不制止 制止 (-2,5) (2,2)(10,4) (5,5) 不仿冒 (0,

2、10) 仿冒 不制止 制止 仿冒 不仿冒 一个动态博弈至少有两个阶 段,因此动态博弈有时也称 为“多阶段博弈” (Multistage Games)或序列 博弈(Sequential Games), 这是由动态博弈中的次序特 征引出来的。 4 子博弈(subgame) 由原博弈中某个决策点(信息集)开始的部 分构成一个子博弈。 分 乙 甲 不借 借 不分 (1,0) (0,4) (2,2) 乙 (-1,0) 5 动态博弈中的战略 战略是一个完备的行动计划:在博弈开始之前 就规定出每一个决策点上的选择,即使这个决 策点实际上不会出现。 考虑老师与学生之间考试之后的一个博弈:老 师先行动(判分),

3、学生后行动(在不同分数 下如何应对)。假定学生的实际成绩是不及格 。 6 接受 老师 学生 学生 及格 不及格 报复 报复 接受 (-10,-10) (-1, 1) (-10, -10) (1, -1) 考试博弈 7 战略表式下的纳什均衡 及格不及格 老师 学生 A,FF,AA,AF,F -1,1-10,-10-1,1 -10,-10 -10,-10 1,-1 1,-1-10,-10 8 不可置信的威胁(noncredible threat) 在(及格;A,F)和(不及格;F,A)中,学生“报 复(F)”的威胁是不可信的:无论老师判“及格”还是“ 不及格”,“报复”不是学生的最优选择; 事前(

4、ex ante)和事后(ex post):一种战略所规定的 行动在事前看来是最优的,但事后看并不是当事人的最 优选择,这种行动就不可置信,该战略就不是一个合理 的战略。 9 相机选择和策略中的可信性问题 不同版本的开金矿博弈分钱和打官司的可信性 乙 甲 (0,4) (2,2) (1,0) 不借 借 分 不分 开金矿博弈 不借 乙 甲 乙 借 不分 分 (1,0) 不打 打 (0,4) (1,0) (2,2) 有法律保障的开金矿博弈 分钱打官司都可信 10 相机选择和策略中的可信性问题 不同版本的开金矿博弈分钱和打官司的可信性 乙 甲 乙 打 (2,2) 不分 分 不借 借 (0,4) (-1,

5、0) 不打 (1,0) 法律保障不足的开金矿博弈 分钱打官司都不可信 11 精炼纳什均衡(perfect NE) 不包含不可置信的行动的战略所组成的纳什均衡被称为 “精炼纳什均衡”;也就是说,不论过去发生了什么, 构成精炼纳什均衡的战略,其所规定的行动在每一个决 策点上都是最优的。所以,又称为“序惯均衡 ”(sequential equilibrium); 序贯理性要求,不论过去发生了,参与人将选择最优的 行动。 首先必须是“纳什均衡”,但并非所有纳什均衡都是合 理的;只有其战略不包含不可置信行动的纳什均衡才是 合理的。 12 子博弈精炼纳什均衡 泽尔腾(1965年)提出了“子博弈完美 纳什均

6、衡”(Subgame Perfect Nash Equilibrium) SPE满足条件: 在原博弈是一个纳什均衡; 在每一个子博弈上都是纳什均衡。 REINHARD SELTEN (1930-) 13 逆向归纳法(backward induction) 从最后一个决策点开始,找出该子博弈的纳什均衡 ;然后再倒回到倒数第二个决策点,找出决策者的 最优决策(假定最后一个决策者的决策是最优的) ;如此一直到初始决策点,所有子博弈上的最优选 择就是精炼纳什均衡。又称“rollback”. 即从最后一个阶段往回推理,剔除“坏”选择,直到 找到唯一的结果。 14 举例 1 2 1 (2,0) (5,0)

7、 (4,2) (1,1) U DR L U D (2,0) 15 均衡路径与非均衡路径 精炼纳什均衡下所经过的决策点和最优选择构 成的路径,称为均衡路径(equilibrium path) ; 其他的路径是非均衡路径(off-equilibrium path); 16 精炼均衡与理性共识 逆向归纳的过程实际上就是重复剔除劣战略 的过程,其前提是博弈规则和理性共识:每 个人是理性的,每个人知道每个人是理性的 ,如此等等。 因此,精炼纳什均衡的合理性取决于理性共 识的合理性。 17 不可置信威胁举例 精炼纳什均衡剔除了不可置信的威胁,使得我 们可以更合理地对博弈中参与人行为的预测; 不可置信威胁的

8、根源是事前最优与事后最优不 同,导致许多帕累托效率无法实现; 管教孩子为什么困难? 大企业为什么效率低?(TBTF) 18 现实生活中的例子 不伤心 女儿 父 母 跳楼 断绝关系 嫁张三 19 承诺(Commitment) 承诺是将不可置信的威胁变成可置信的威胁的行动 :威胁不仅事前是最优的,事后也是最优的。 承诺意味着限制自己的自由:选择少反而对自己好 。 占岛断桥 如“破釜沉舟”的故事。 20 生产的选择 白酒企业 啤酒企业 (10,100) (100,10) (1000,1000) 不上啤酒 上啤酒 不扩大 扩大 21 启迪 现实生活中,企业通常是要保守商业秘 密,但是有时又要故意泄露商

9、业秘密, 这种故意泄露出来的商业秘密就可以看 作是一种承诺。 22 承诺举例 婚姻中的承诺:彩礼、昂贵的婚礼可以理 解为一种对婚姻的承诺; 订金、抵押物做为对交易的承诺; 固定资产投资可以作为承诺; 所有权的承诺作用; 23 作为承诺的法律 法律改变事后的选择空间或选择成本,所以 可以起到承诺的作用; 刑法:为什么不能商量?为什么对严重犯罪 要执行死刑? “法治”(rule of law)是政府的承诺; 24 最惠条款 The “Most-favored-Customer” Clause 生产耐用品的企业经常被“降价预期”所困扰 :如果消费者预期企业将降价,他们将会等 待,结果企业只能降价。如

10、汽车行业面临的 问题; 最惠条款可以起到承诺的作用:企业不会降 价了。 25 例子 产量价格收入 1 2 3 4 100 80 40 30 100 160 120 120 假定企业一开始定价80, 如果前两个消费者购买了 ,企业将有积极性在40的 价格下向第三个顾客出售 。预期到这一点,前两个 顾客将不会购买。如果企 业向顾客保证,任何降价 的差额将返还顾客,前两 个顾客将会购买。因为企 业事实上不会降价了。 26 最惠条款对谁有利? 10, 101, 14 14,15,5 不 降降 价 不 降 降 价 不实行“最惠客待遇” 公司 2 公 司 1 27 最惠条款对谁有利? 10, 101, 9

11、 9,15,5 不 降降 价 不 降 降 价 实行“最惠客待遇” 公司 2 公 司 1 28 承诺的特点 承诺不是空话,需要投资,花费代价。 承诺无法反悔。 承诺可以达到默契同谋的目的。 承诺是动态博弈里经常采用的手段。 29 先动优势与后动优势 先动优势(first-mover advantage),是指一步领先 ,步步领先的“马太效应”。 后动优势(second-mover advantage),是指可以在 前人发展的基础上发展,而不必付出探索的成本和 代价。 两句似乎矛盾的成语:先发制人和后发制人。 30 强盗分金 5个强盗抢得100枚金币,他们决定: 抽签决定各人的号码(1、2、3、4

12、、5); 1号提出分配方案,然后5人表决,当超过半数同 意时,方案通过,否则1号将被扔入大海喂鲨鱼; 1号死后,2号提出方案,4人表决,当超过半数 同意时,方案通过,否则,2号同样被扔入大海; 以此类推 31 强盗分金 假设每个强盗都是经济学假设的“理性人 ”,都能很理智地判断得失,作出选择, 为了避免不必要的争执,我们还假定每 个判决都能顺利执行。那么,如果你是 第一个强盗,你该如何提出分配方案才 能够使自己的收益最大化? 32 出乎意料的答案 许多人公认的标准答案是:1号强盗分给 3号1枚金币,4号或5号强盗2枚,独得97 枚。分配方案可写成(97,0,1,2,0) 或(97,0,1,0,

13、2)。 33 启示 在“强盗分金”模型中,任何“分配者”想 让自己的方案获得通过的关键是事先考虑 清楚“挑战者”的分配方案是什么,并用最 小的代价获取最大收益,拉拢“挑战者”分 配方案中最不得意的人们。 34 应用 在国际政治、经济中,各国地位是不平 等的,存在着“先动”和“后动”的区别 。 35 几个经典动态博弈模型 寡占的斯塔克博格模型 劳资博弈 讨价还价博弈 委托人代理人理论 36 斯塔克博格(Stackelberg)模型 37 斯塔克博格(Stackelberg)模型 38 斯塔克博格(Stackelberg)模型 产量 得益 厂商1 3单位 4.5 厂商2 1.5单位 2.25 先动

14、优势 39 练习 两个寡头企业进行价格竞争博弈,企业1 、2的利润函数如下: 40 问题 两个企业同时决策的纯策略纳什均衡; 企业1先决策的子博弈完美纳什均衡; 企业2先决策的子博弈完美纳什均衡。 41 参考答案 两个企业同时定价。根据两个企业的得 益函数,导出各自的反应函数: 42 参考答案 两个企业同时决策时的纳什均衡是: 此时两个企业的利润: 43 参考答案 企业先决策。根据逆推归纳法,先求企业 的反应函数: 代入企业的利润函数,得到: 44 参考答案 再求企业的反应函数: 因此企业先决策时的子博弈完美与两个 企业同时定价时相同,利润也相同。这实际上 是因为本博弈中后行为的企业的选择与先

15、行 为的企业的选择无关。 45 参考答案 企业先决策。根据逆推归纳法,先求企业 的反应函数: 代入企业的利润函数,得到: 46 参考答案 再求企业的反应函数: 再把该价格代入企业的反应函数,得: 47 参考答案 此时企业的利润: 48 参考答案 此时企业的利润: 49 劳资博弈 先由工会决定工资率,再由厂商决定雇用多少劳 动力 W L R L 0 厂商的反应函数 R(L) 斜率为W 50 劳资博弈 L W 0 工会的无差异曲线 51 一个简单的例子 两个兄弟分一块冰激凌。哥哥先提出一个分割比例,弟 弟可以接受或拒绝,接受则按哥哥的提议分割,若拒绝 就自己提出一个比例。但这时候冰激凌已化得只剩1

16、/2 了。对弟弟提议的比例哥哥也可以选择接受或拒绝,若 接受则按弟弟的提议分割,若拒绝冰激凌会全部化光。 因为兄弟之间不应该做损人不利已的事,因此我们假设 接受或拒绝利益相同时兄弟俩都会接受。求该博弈的子 博弈完美纳什均衡。 52 扩展型表示 哥 哥 不接受,出S 接受 不接受,出S2 弟 接受 出S1 53 三回合讨价还价博弈 1 1 2 不接受,出S 接受 不接受,出S2 接受 出S1 强制 力 假设任一博弈方只要得益不小于下一回合自己出价时的 得益,就愿意接受对方的出价 54 三回合讨价还价博弈结果的讨论 55 无限回合讨价还价 56 博弈论向自己出难题 Centipede 博弈 (1,

17、0)(0,2)(3,0)(0,4)(0,N-1) (N,0) (0,N+1) ABABBA 57 旅行者困境(Travelversdilemma) 两个旅行者旅行回来,提取行李的时 候,发现托运的花瓶被摔坏,于是向 航空公司索赔。航空公司知道花瓶的 价格大约在八九十元浮动,但不知道 确切价格。于是请两位旅客在100元 以内自己写下花瓶价格,如果写的一 样,公司将认为他们讲真话并赔偿, 如果不一样,公司就论定写得低的旅 客讲的是真话,并原则上照这个价格 赔偿,但是对讲真话的旅客奖励2元 ,对讲假话的旅客罚款2元。 58 This is the last slide in Chapter F5. This is the last slide in Chapter F5. Chapter F5 59

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 其他


经营许可证编号:宁ICP备18001539号-1