正大光明公正無私ppt课件.ppt

上传人:本田雅阁 文档编号:3390669 上传时间:2019-08-21 格式:PPT 页数:148 大小:684.07KB
返回 下载 相关 举报
正大光明公正無私ppt课件.ppt_第1页
第1页 / 共148页
正大光明公正無私ppt课件.ppt_第2页
第2页 / 共148页
正大光明公正無私ppt课件.ppt_第3页
第3页 / 共148页
正大光明公正無私ppt课件.ppt_第4页
第4页 / 共148页
正大光明公正無私ppt课件.ppt_第5页
第5页 / 共148页
点击查看更多>>
资源描述

《正大光明公正無私ppt课件.ppt》由会员分享,可在线阅读,更多相关《正大光明公正無私ppt课件.ppt(148页珍藏版)》请在三一文库上搜索。

1、正 大 光 明 公 正 無 私,1,博 弈 论 the Theory of Games,博弈论2009,正大光明 公正無私 幫助別人 成就自己,2,主要内容,一、博弈现象及基本概念 二、完全信息静态博弈 三、完全信息动态博弈 四、不完全信息静态博弈 五、不完全信息动态博弈 六、不完全信息专题,博弈论2009,正大光明 公正無私 幫助別人 成就自己,3,主要参考书,姚国庆:博弈论,高等教育出版社,2007. 罗云峰:博弈论教程,清华大学出版社、北京交通大学出版社。 张维迎:博弈论与信息经济学,上海三联书店,上海人民出版社,2004。 施锡铨,博弈论,上海财经大学出版社,2002。,博弈论2009

2、,正大光明 公正無私 幫助別人 成就自己,4,张守一,现代经济对策论,高等教育出版社,1998。 钱颂迪,运筹学,清华大学出版社,1996。 美艾里克.拉斯缪森:博弈与信息,北京大学出版社,2003。 美弗登博格:博弈论,中国人民大学出版社,2002。,博弈论2009,正大光明 公正無私 幫助別人 成就自己,5,第四讲 不完全信息静态博弈 (贝叶斯博弈),1基本思想 2. 静态贝叶斯博弈的表述与均衡 3. 不完全信息竞争模型 4. 拍卖与投标 5. 机制设计与显示原理,博弈论2009,正大光明 公正無私 幫助別人 成就自己,6,1基本思想,不完全信息: 至少有一个局中人不知道其它局中人的支付函

3、数(类型) 类型:所拥有的个人信息,即所有不是共同知识的信息,包括策略空间、信息集、支付函数等。,博弈论2009,正大光明 公正無私 幫助別人 成就自己,7,海萨尼(Harsanyi)转换 引入虚拟的局中人自然(nature); 自然首先行动决定局中人的特征,然后局中人再同时行动; 局中人知道自己的特征,其它局中人不知道; 则不完全信息博弈转换为完全但不完美信息动态博弈。,博弈论2009,正大光明 公正無私 幫助別人 成就自己,8,约翰海萨尼 John C. Harsanyi 19202000 美籍匈牙利经济学家 1964年任教于柏克莱加州大学 1994年因对不完全信息博弈的开创性研究获诺贝尔

4、经济学奖。,博弈论2009,正大光明 公正無私 幫助別人 成就自己,9,引例:市场进入博弈,博弈论2009,正大光明 公正無私 幫助別人 成就自己,10,易证:进入条件 p15,博弈论2009,正大光明 公正無私 幫助別人 成就自己,11,2.静态贝叶斯博弈的表述与均衡 n人静态Bayes博弈 局中人行动空间A1,A2,An,他们的类型空间T1,T2,Tn,以及他们的信念:p1,p2,pn,各局中人的盈利函数u1,u2,un。局中人i的类型ti为i私人所知,它确定了i的盈利函数 ,,博弈论2009,正大光明 公正無私 幫助別人 成就自己,12,局中人i的信念 描述了局中人i在给定自己类型ti的

5、条件下关于其它(n-1)个局中人的可能类型ti的不确定性。 此博弈表述为:,博弈论2009,正大光明 公正無私 幫助別人 成就自己,13,信念:通过Bayes法则计算 如局中人的类型是随机独立的,则 将不依赖于ti,即: (注: ,表示其它所有类型的组合)。,博弈论2009,正大光明 公正無私 幫助別人 成就自己,14,均衡 对于静态Bayes博弈 , 策略 是一个(纯策略)Bayes均衡,当且仅当,对每一个局中人i和Ti中的每一个类型ti以及局中人i的每一个其他策略 , 最大 。 也就是说,无论局中人属何种类型,局中人的策略一定是关于其他局中人策略行动的最佳反应。,博弈论2009,正大光明

6、公正無私 幫助別人 成就自己,15,例:进入阻扰博弈,博弈论2009,正大光明 公正無私 幫助別人 成就自己,16,博弈论2009,正大光明 公正無私 幫助別人 成就自己,17,建立海萨尼转换后新博弈的策略型表达式:,博弈论2009,正大光明 公正無私 幫助別人 成就自己,18,每格的条件期望盈利为: 进入者,(高成本在位者,低成本在位者) 唯一的纳什均衡: 不进入,(不扩张,扩张),博弈论2009,正大光明 公正無私 幫助別人 成就自己,19,3.不完全信息Cournot竞争模型 描述: 价格函数为: 公司1的成本函数是: 公司2的成本函数是: 其中,博弈论2009,正大光明 公正無私 幫助

7、別人 成就自己,20,信息非对称: 公司2知道自己的成本函数和公司1的成本函数; 公司1知道自己的成本函数,而对公司2的成本函数无法完全确定。 共同知识:概率; 公司2有比1优越的信息。,博弈论2009,正大光明 公正無私 幫助別人 成就自己,21,公司2的问题 : 对于不同边际成本选择不同的产量q2 如取高成本 如取低成本,博弈论2009,正大光明 公正無私 幫助別人 成就自己,22,公司1的问题 : 仅知道公司2取CH与CL的两点分布; 产量q1是唯一的。,博弈论2009,正大光明 公正無私 幫助別人 成就自己,23,解之:,博弈论2009,正大光明 公正無私 幫助別人 成就自己,24,分

8、析: 低成本下产量更高 低成本企业的产量相对较低,高成本企业的产量相对较高,博弈论2009,正大光明 公正無私 幫助別人 成就自己,25,原因:因为公司1不知道C2时,只能生产预期的最优产量,则出现: 如公司2的成本为CL:公司1则低估其产量,公司2产量偏低 如公司2的成本为CH:公司1则高估其产量,公司2产量偏高 纳什均衡和贝叶斯均衡相互比较的图示,博弈论2009,正大光明 公正無私 幫助別人 成就自己,26,博弈论2009,正大光明 公正無私 幫助別人 成就自己,27,4.拍卖与投标 概述 拍卖:(招标与之同理) 以公开竞价的形式,由拍卖机构在一定时间和地点,按照一定的章程和规则,将特定物

9、品或者财产权转让给最高应价者的一种买卖方式。 信息经济学:维克瑞Vickery,1996年诺贝尔经济学奖。,博弈论2009,正大光明 公正無私 幫助別人 成就自己,28,WILLIAM VICKREY,1914:生于加拿大 1947:哥伦比亚大学博士 1964:哥伦比亚大学任教 1979:芝加哥大学人文学博士 1996:因 “在不对称信息下对激励经济理论作出的奠基性贡献”,获诺贝尔经济学奖 。三天后去世。,博弈论2009,正大光明 公正無私 幫助別人 成就自己,29,拍卖历史:古巴比伦拍卖妇女; 罗马帝国拍卖奴隶; 中国古代拍卖和尚死后物品。 拍卖条件:人口规模;剩余产品;货币制度 拍卖功能:

10、价格揭示。 合法性:三公一高原则。 公开公平公正,价高者得。,博弈论2009,正大光明 公正無私 幫助別人 成就自己,30,拍卖类型 英式:初始价或无底价,增价, 同质多个时重复。 荷兰式:高价开始, 减价, 至保留价则取消, 如同质多个则继续减价。 第一价格:密封,投标,最高价获得, 以最高价结算。,博弈论2009,正大光明 公正無私 幫助別人 成就自己,31,第二价格:密封,最高价获得, 以第二价格结算。 双方叫价:卖者买者同时出价, 拍卖商选择成交价清算。 开放式:英式、荷兰式、双方叫价(动态) 密封式:第一价格、第二价格(静态),博弈论2009,正大光明 公正無私 幫助別人 成就自己,

11、32,拍卖的博弈论假定 不完全信息: 每个投标者只知道自己的私人价值和别人私人价值的主观概率,并成为共同知识。 非合作:无强制性协议; 独立决策。,博弈论2009,正大光明 公正無私 幫助別人 成就自己,33,要素: 局中人:一个拍卖人(卖方), 若干投标人(买方) 拍卖物品:个数;质量;价值;信息分布 支付函数:拍卖人、投标者 拍卖策略:最优底价,入场费,博弈论2009,正大光明 公正無私 幫助別人 成就自己,34,拍卖过程分析: 第一价格密封拍卖* 设 投标人 i=1,2 出价 bi0, 私人价值 vi (投标人类型,只有自己知道), vi是0,1上的均匀分布函数。,博弈论2009,正大光

12、明 公正無私 幫助別人 成就自己,35,i的支付函数 vi-bi, bibj ui(bi,bj,vi)= (vi-bi)/2, bi=bj 0, bi1vi不可能最优。,博弈论2009,正大光明 公正無私 幫助別人 成就自己,36,考虑对称的出价策略:b=b*(v) 给定v和b,投标人i的期望支付为: ui=(v-b) P(bjb) 第一项:给定赢的情况下投标人i的净所得; 第二项:投标人i赢的概率。,博弈论2009,正大光明 公正無私 幫助別人 成就自己,37,根据对称性,bj=b*(vj),所以 P(bjb)=P(b*(vj)b) =P(vjb*-1(b)(b)= (b) 其中:(b)b*

13、-1(b)是b*的逆函数, 表示投标人选择b时他的价值是(b)。,博弈论2009,正大光明 公正無私 幫助別人 成就自己,38,投标人i的问题: max(ui)=(v-b)P(bjb)=(v-b)(b) 一阶条件:-(b)(v-b) (b)=0 最优策略下: (b)v,因此 v=(v-b)v 解之得:b*=v/2 结论:每个投标人的出价是其私人价值的一半,博弈论2009,正大光明 公正無私 幫助別人 成就自己,39,如果人数为n: 可以证明,b*(v)=(n-1)v/n 说明:投标人越多,卖者得到价格越高; 让更多人投标是卖者利益所在。,博弈论2009,正大光明 公正無私 幫助別人 成就自己,

14、40,其它问题 拍卖物品价值类型: 私人价值:不再出售;信息有助于出价但不改变估价。 共同价值:价值相同;估价不同;信息会改变估价;例:债券拍卖 相关价值:价值不同;估价相关;共同价值特例;现实情况。,博弈论2009,正大光明 公正無私 幫助別人 成就自己,41,阻止买者串谋: 拍卖目的之一; 第一价格密封出价最有利。 胜利者诅咒: the winners curse; 共同价值拍卖,赢得者有最大正误差,出价过高。,博弈论2009,正大光明 公正無私 幫助別人 成就自己,42,中国拍卖市场 拍卖方式:英式竞价 拍卖物品:收藏品;专利权;企业产权;标记权;公共事业项目;反腐倡廉;国债发行 法律:

15、中华人民共和国拍卖法,1997年1月1日起实行。 从业:拍卖师制度,1997年起统一考试。,博弈论2009,正大光明 公正無私 幫助別人 成就自己,43,5.机制设计与显示原理 机制设计概念 定义:给定一组n个局中人,已知其盈利函数及相关私人信息,构造一静态Bayes博弈,使其均衡满足特定性质。 本质:求解博弈均衡的逆向问题,即博弈规则选择问题。是一种特殊的不完全信息博弈。,博弈论2009,正大光明 公正無私 幫助別人 成就自己,44,2007年诺贝尔经济学奖,明尼苏达大学经济学教授 利奥赫尔维茨(Leonid Hurwicz) 新泽西普林斯顿高等研究院教授 埃瑞克马斯金(Eric S. Ma

16、skin) 芝加哥大学经济学教授 罗格迈尔森(Roger B. Myerson) 贡献:为“机制设计理论奠定了基础” (Mechanism Design Theory),博弈论2009,正大光明 公正無私 幫助別人 成就自己,45,Leonid Hurwicz(1917) 激励相容,Eric S. Maskin(1950-) 实施理论,Roger B. Myerson(1951-) 显示原理,博弈论2009,正大光明 公正無私 幫助別人 成就自己,46,例: 拍卖问题中为了最高卖价,如何在给定众多出售方式中选择? 政府税收政策制定; 雇主对雇员职位安排; 保险公司收费和赔偿政策。,博弈论200

17、9,正大光明 公正無私 幫助別人 成就自己,47,委托人机制设计 委托人:principal, 一个,支付函数为共同知识。 代理人:agents, 一个或多个,支付函数只有自己知道。 委托人设计目标:最大化期望效用函数,博弈论2009,正大光明 公正無私 幫助別人 成就自己,48,参与约束(个人理性约束):可行机制 代理人参与博弈有更大期望效用,即大于保留效用(机会成本)。 激励相容约束:可实施机制 代理人有积极性选择委托人希望的行动,即有更大期望效用。,博弈论2009,正大光明 公正無私 幫助別人 成就自己,49,三阶段不完全信息博弈: 委托人设计博弈规则; 代理人同时接受或不接受委托人设计

18、的机制; 接受机制的代理人根据规则进行博弈。,博弈论2009,正大光明 公正無私 幫助別人 成就自己,50,显示原理 revelation principle(Myerson,1979) 假定以Mi(i=1,2,.n)为信号空间和以ym(.)为配置函数的机制的贝叶斯均衡是: *(.)=i*(i), i*Mi,ii, 其中i是代理人i的类型空间。 那么,存在一个以Mi=i为信号空间的直接显示机制y=ym(*(.),它的信号空间恰为类型空间。,博弈论2009,正大光明 公正無私 幫助別人 成就自己,51,该机制的贝叶斯均衡是:所有代理人在第二阶段接受机制,在第三阶段同时报告自己的真实类型。 意义:

19、 任何一个机制所能达到贝叶斯均衡分配结果均可以通过一个讲真话的直接机制实现。所以委托人只考虑直接机制设计即可。,博弈论2009,正大光明 公正無私 幫助別人 成就自己,52,所罗门王的故事,两个女人抱着一个男婴来到所罗门王跟前,要求他评判到底谁是真的母亲。所罗门王见她们争执不下,便喝令侍卫拿一把剑来,要把孩子劈成两半,一个母亲一半。 这时其中一个女人说:“大王,不要杀死孩子。把孩子给她吧,我不和她争了”。 所罗门王听了却说:“这个女人才是真的母亲,把孩子给她。”,博弈论2009,正大光明 公正無私 幫助別人 成就自己,53,第五讲 不完全信息动态博弈,1.博弈描述及均衡 2.精炼(完美)Bay

20、es纳什均衡 3.信号博弈 4.劳务市场信号博弈,博弈论2009,正大光明 公正無私 幫助別人 成就自己,54,1.博弈描述及均衡 描述 “自然”首先选择参与人类型; 参与人先后开始行动; 后行动者通过观察先行动者的行动推断其类型或修正其先验信念; 后行动者选择最优行动; 先行动者知道知道自己的行动会被利用而设法传递有利于自己的信号。,博弈论2009,正大光明 公正無私 幫助別人 成就自己,55,特征 参与人选择行动并不断修正信念。 不能简单地应用子博弈完美进行精炼。 应用后验信念对Bayes均衡进行精炼。 例:强弱博弈;黔驴技穷; 垄断限价模型; 信号传递模型。,博弈论2009,正大光明 公

21、正無私 幫助別人 成就自己,56,均衡思路 给定有关其它人的类型的信念,参与人的策略在每一个信息集开始的“后续博弈”上构成Bayes均衡; 参与人使用Bayes法则修正有关其它人的类型的信念。 后续博弈:从每一个信息集开始的博弈剩余部分,不同于子博弈。,博弈论2009,正大光明 公正無私 幫助別人 成就自己,57,Bayes法则举例 类型:好人GP;坏人BP。 信息:好事GT;坏事BT。 一个人做好事的概率:,博弈论2009,正大光明 公正無私 幫助別人 成就自己,58,假定观测到一个人做了一件好事,那么他是好人的后验概率(信念)为:,博弈论2009,正大光明 公正無私 幫助別人 成就自己,5

22、9,例:市场进入博弈 两个阶段: 第一阶段,有一个垄断企业,潜在进入者考虑是否进入; 第二阶段,如果进入则进行Cournot博弈,否则仍然是垄断。,博弈论2009,正大光明 公正無私 幫助別人 成就自己,60,在位者两个类型:高成本、低成本 进入者先验信念:高成本概率 进入者一个类型:进入成本为2,进入后与高成本在位者相同 价格选择:p=4,5,6 相应利润:高成本 2,6,7 低成本 6,9,8,博弈论2009,正大光明 公正無私 幫助別人 成就自己,61,单阶段最优: 高成本p=6;低成本p=5 进入后: 高成本,则对称, p=5,利润分别为3, 扣除进入成本为(3,1) 低成本,非对称,

23、 p=4,利润为(5,1), 扣除进入成本为(5,1),博弈论2009,正大光明 公正無私 幫助別人 成就自己,62,博弈论2009,正大光明 公正無私 幫助別人 成就自己,63,问题: 价格选择会影响进入者的信念和行动,所以单阶段最优价格不是均衡。 在位者必须考虑价格选择的信息效应。 价格选择不仅取决于成本函数,还与进入者先验概率有关。,博弈论2009,正大光明 公正無私 幫助別人 成就自己,64,分析: 考虑贝叶斯均衡:1/2,进入者总是不进入,在位者单阶段最优垄断价格即最优选择。 但这不是精炼均衡,因为包含了不可置信威胁:进入者不修正信念。,博弈论2009,正大光明 公正無私 幫助別人

24、成就自己,65,若在位者选择p=6,则进入者没有理由认为是低成本; 反之,p=6一定不是高成本在位者的最优选择。 若p=6,进入者后验概率1,则总利润7310; 若模仿低成本,p=5,进入者后验概率0,则总利润6+713。,博弈论2009,正大光明 公正無私 幫助別人 成就自己,66,2.精炼(完美)Bayes纳什均衡 颤抖的手完美均衡 Trembling-hand perfect 策略组合s*,对于任意的,存在着一个位于0,1区间上的正数向量1,n和一个完全混合策略向量1,n,使得每一个策略都被策略(1-i)si+in所取代的新博弈有一个纳什均衡,且该纳什均衡中的每一个策略和s*的距离小于。

25、,博弈论2009,正大光明 公正無私 幫助別人 成就自己,67,例:,弱纳什均衡:(出,下),(出,上),(进,上) 子博弈完美均衡: (出,上),(进,上) 颤抖的手完美均衡:(出,上),博弈论2009,正大光明 公正無私 幫助別人 成就自己,68,完美Bayes均衡 一个完美Bayes均衡由满足以下条件的策略与信念构成: R1:在每一个信息集,具有行动的局中人关于博弈到达哪个决策结必须有一个信念,即各结的概率分布。 R2:在给定的信念下,局中人的策略必须是序贯理性的。即具行动的局中人所采取的行动在给定信念与其它局中人以后策略下是最优的。,博弈论2009,正大光明 公正無私 幫助別人 成就自

26、己,69,R3:局中人在均衡路径上信息集的信念,是通过Bayes法则与局中人的均衡策略来确定的。 R4:在非均衡路径上信息集的信念通过Bayes法则与局中人可能的均衡策略来确定。,博弈论2009,正大光明 公正無私 幫助別人 成就自己,70,引例,博弈论2009,正大光明 公正無私 幫助別人 成就自己,71,结论:(R,B)不可信; 子博弈精炼无效; 需要进一步精炼。 问题: 2的信息集双结,需要一定信念。 增加条件:R1、R2。,博弈论2009,正大光明 公正無私 幫助別人 成就自己,72,博弈论2009,正大光明 公正無私 幫助別人 成就自己,73,局中人2: A: , B: , 2p1p

27、 A优于B 根据条件R2,(R,B)不是均衡。,博弈论2009,正大光明 公正無私 幫助別人 成就自己,74,增加条件: R3,对均衡路径上的信念作出要求; R4,对非均衡路径上的信念作出要求; (后验概率),问题:信念合理吗?,博弈论2009,正大光明 公正無私 幫助別人 成就自己,75,例:存在一个真子博弈.,博弈论2009,正大光明 公正無私 幫助別人 成就自己,76,唯一子博弈完美均衡(D,L,R),博弈论2009,正大光明 公正無私 幫助別人 成就自己,77,验证: R1:引入p,1-p R2:从3看,R是2的劣策略 R3:3的后验概率p=1 R4:不存在可能策略 完美Bayes均衡

28、: 策略组合(D,L,R),后验概率p=1,博弈论2009,正大光明 公正無私 幫助別人 成就自己,78,例:市场进入博弈 1/2:混同均衡pool equilibrium 给定进入者的后验概率和策略, 高成本:p=6时,进入者进入,利润7310 p=5时,进入者不进入,利润6713 即p=5为最优。 低成本:p=5时,进入者不进入,利润9918, 最优,博弈论2009,正大光明 公正無私 幫助別人 成就自己,79,给定两类在位者都选择p=5, (5)=(1)/(1+1(1-) =1/2, 即进入者未能从观测到的价格中得到任何新信息。 进入期望利润 1+(1-)(-1)= 2-10, 不进入是

29、最优的。,博弈论2009,正大光明 公正無私 幫助別人 成就自己,80,结论: 均衡为两类在位者选择相同价格; 高成本在位者通过选择与低成本相同的价格隐藏自己; 低成本在位者也不需披露自己是低成本的事实。,博弈论2009,正大光明 公正無私 幫助別人 成就自己,81,1/2:分离均衡 sepsrating equilibrium 若进入者得不到新信息,将选择进入。 给定进入者的后验概率和策略, 低成本: p=4时,进入者不进入,利润6915 p=5时,进入者进入,利润9514 即p=4为最优。,博弈论2009,正大光明 公正無私 幫助別人 成就自己,82,高成本: p=4时,进入者不进入,利润

30、279, p=6时,进入者进入,利润7310, 即p=6为最优。 给定在位者的策略,后验概率为 (6)=1,(4)=0 进入者的最优策略: 观测到p=6进入,观测到p=4不进入。,博弈论2009,正大光明 公正無私 幫助別人 成就自己,83,结论: 高成本在位者选择单阶段最优价格; 低成本在位者为了区别高成本选择非单阶段最优价格; 不完全信息带来的结果是低成本者支付“认证费用”。,博弈论2009,正大光明 公正無私 幫助別人 成就自己,84,3.信号博弈 描述 局中人:发送者S;接收者R。 S与R的效用函数: US(ti,mj,ak) UR (ti,mj,ak),博弈论2009,正大光明 公正

31、無私 幫助別人 成就自己,85,时序: 自然按概率分布p(ti)为发送者从一个可行类型空间T中选择ti; 发送者S观察到ti后,从一个可行集号集M中选取一个信号mj; 接收者R观察到信号mj (不是ti)从可行行动集合A中选择行动ak;,博弈论2009,正大光明 公正無私 幫助別人 成就自己,86,例: 自然N,Tt1,t2; M=m1,m2; A=a1,a2, 概率p 发送者策略为信号选择,是类型的函数,m(ti) 接收者策略为行动方案,是其所看到的发送者信号的函数,a(mj),博弈论2009,正大光明 公正無私 幫助別人 成就自己,87,博弈论2009,正大光明 公正無私 幫助別人 成就自

32、己,88,发送者S纯策略: S(1):(t1,m1);(t2,m1) S(2):(t1,m1);(t2,m2) S(3):(t1,m2);(t2,m1) S(4):(t1,m2);(t2,m2),接收者R纯策略: R(1):(m1,a1);(m2,a1) R(2):(m1,a1);(m2,a2) R(3):(m1,a2);(m2,a1) R(4):(m1,a2);(m2,a2),博弈论2009,正大光明 公正無私 幫助別人 成就自己,89,均衡 SR(1):接收者R在观察到来自M的mj后,建立发送者类型的信念(ti|mj)。 SR(2R):对于每一个mj ,接收者R选择行动a*(mj),使在给

33、定信念下期望效用最大。 SR(2S):在给定接收者策略a*(mj)下,类型ti的发送者发出信号m*(ti),使自己期望收益最大。,博弈论2009,正大光明 公正無私 幫助別人 成就自己,90,SR(3):对于发送者m*(ti)=mj,接收者信念由Bayes法则与发送者策略决定。 均衡: 信号博弈的纯策略完美Bayes均衡由满足以上条件的策略m*(ti),a*(mj)与信念(ti|mj)所组成 。,博弈论2009,正大光明 公正無私 幫助別人 成就自己,91,续前例:前例赋予盈利向量,博弈论2009,正大光明 公正無私 幫助別人 成就自己,92,(1)共用m1: (m1,m1)下, R的信念:(

34、p,1-p)(0.5,0.5) R的选择:a2是严格劣策略,a1为最优选择。 t1和t2的收益:分别为1和2。,博弈论2009,正大光明 公正無私 幫助別人 成就自己,93,判断m1是否t1和t2的最佳选择:检查若发m2,R如何反应。 若对m2选择行动a2,t1和t2的收益:分别为0和1。m2劣于m1。 若对m2选择行动a1,t1和t2的收益:分别为2和1。t2劣,t1优。,博弈论2009,正大光明 公正無私 幫助別人 成就自己,94,R选a1:q1+(1-q)0=q R选a2:q0+(1-q)2=2(1-q) 令 2(1-q)=q;q=2/3, 在此信念下对m2选择a2。 均衡: (m1,m

35、1),(a1,a2),p=0.5,q=2/3,博弈论2009,正大光明 公正無私 幫助別人 成就自己,95,(2)共用m2: (m2,m2)下, R的信念:q0.52/3 R的选择:a2为最优选择(如上述证明)。 t1和t2的收益:分别为0和1。m2劣于m1。 所以, (m2,m2)不是均衡策略。,博弈论2009,正大光明 公正無私 幫助別人 成就自己,96,(3)分离: (m1,m2 ) R的信念:p=(t1/m1)=1 1-q=(t2/m2)=1 q=02/3. R的选择:观测到m1选择a1, 观测到m2选择a2。 t1和t2的收益:都为1。 对于t2若发送m1,R行动a1,t2可盈利2,

36、优于m2。所以, (m1,m2)不是均衡策略。,博弈论2009,正大光明 公正無私 幫助別人 成就自己,97,(4)分离: (m2,m1 ) R的信念:p=0 q=12/3. R的选择:(a1,a1) t1和t2的收益:均为2。 对于t1若发送m1,R行动a1,t1盈利1,劣于m2 对于t2若发送m2,R行动a1,t2盈利1,劣于m1 均衡:(m2,m1),(a1,a1),p=0,q=1,博弈论2009,正大光明 公正無私 幫助別人 成就自己,98,4.劳务市场信号博弈 Job-market signaling 斯宾塞Spence,1973。 描述 局中人:雇主;雇员。 雇员盈利函数:Uw-c

37、(,s) 雇佣后雇主盈利函数:y(,s)-w,博弈论2009,正大光明 公正無私 幫助別人 成就自己,99,时序: 自然确定雇员能力,可能为高(H)或低(L)。P(=L)=p 雇员认识到自己的能力是高还是低,然后选择一个教育水平s=0。 雇主观察到雇员的教育水平(而不是能力),然后同时对雇员开出工资价码。 雇员接受较高的工资w。,博弈论2009,正大光明 公正無私 幫助別人 成就自己,100,完美Bayes均衡 一般假设: y(H,s)y(L,s)对一切s成立。 ys(,s)=0,教育具有正效应。 cs(L,s)Cs(H,s),低能力者教育成本较大。 s的量化:在学年数,名牌,成绩。 有争议。

38、,博弈论2009,正大光明 公正無私 幫助別人 成就自己,101,均衡: (1)雇员选择教育水平s() (2)雇主根据s得出后验概率(=L/s)支付w(s),使 给定w(s),s()是雇员最优选择。 给定s(),(=L/s)与Bayes法则一致,w(s)是雇主最优选择。,博弈论2009,正大光明 公正無私 幫助別人 成就自己,102,教育不影响劳动生产率情形下的均衡 假设: 雇员 1(低),2(高)。 低成本先验概率 =1/2; 教育水平 s=0,1 雇员教育成本 c(,s)=s/(分离条件) 效用 U(s,)w-s/ 雇主产出 y=,利润 (s,)-w(s),博弈论2009,正大光明 公正無

39、私 幫助別人 成就自己,103,特征: 教育本身无价值却花费成本; 多个雇主时,合并成为市场 市场完全竞争情况下: 工资劳动生产率, 0 信息对称:s=0为最优 信息不对称:y=1.5,w=1.5。 教育传递信号则不同,博弈论2009,正大光明 公正無私 幫助別人 成就自己,104,(1)混同均衡:s=0 (s=1不构成均衡) s(=1)s(=2)=0 w(0)=w(1)=1.5 (=1/s=0)=0.5 (=1/s=1)=0.5,博弈论2009,正大光明 公正無私 幫助別人 成就自己,105,给定雇主支付工资与教育水平无关(w1.5)和雇主的后验概率(=1/s=1)=0.5,雇员最优选择是不

40、接受教育(s=0)。 给定雇员选择不接受教育,s=1是不可能事件,(=1/s=1)=0.5符合贝叶斯法则,雇主最优选择w1.5。 结论:雇主观察到s=1时不修正先验概率,认为教育不传递信号。,博弈论2009,正大光明 公正無私 幫助別人 成就自己,106,(2)分离均衡: s(=1)0;s(=2)=1 w(0)=1;w(1)=2 (=1/s=0)=1 (=1/s=1)=0 给定雇主的后验概率和工资决策,高能力员工选择接受教育,低能力员工选择不接受教育。,博弈论2009,正大光明 公正無私 幫助別人 成就自己,107,因为:U(s=1,=2)=2-1/2=1.5 U(s=0,=2)=1-0/2=

41、1 U(s=0,=1)=1-0/1=1 = U(s=1,=1)=2-1/1=1 容易验证:给定雇员的选择,雇主的后验概率由贝叶斯法则得到,工资决策是最优的。 结论:雇主认为受教育的雇员一定是高能力的 上述混同均衡不成立。 不存在其它分离均衡。,博弈论2009,正大光明 公正無私 幫助別人 成就自己,108,第六讲 不对称信息,1. 委托代理模型 2. 隐藏行动的道德风险 3. 隐藏知识的道德风险 4. 逆向选择 5. 信号传递 6. 信息甄别,博弈论2009,正大光明 公正無私 幫助別人 成就自己,109,1.委托代理模型 principal-agent model 委托人:雇佣代理人执行任务

42、,处于信息劣势的局中人。也称为不知情者。 代理人:在博弈中某个时点取得类型、行动或外部世界方面的信息优势,也称为知情者。,博弈论2009,正大光明 公正無私 幫助別人 成就自己,110,隐含假设:存在一个法庭,对能够用公共信息证实的违约行为施加处罚。 道德风险模型: 事后不对称信息;不确定性;完全信息 隐藏行动;隐藏信息。 逆向选择模型: 事前不对称信息;不完全信息。 逆向选择;信号传递;信息甄别。,博弈论2009,正大光明 公正無私 幫助別人 成就自己,111,解决代理问题的方法 声誉:根据经理过去的努力及可信任程度对其提升。 风险分担合同:经理不仅得到薪水,而且得到对企业股票的看涨期权。如

43、果降低了股票价值,他的期权价值也会下降。 油锅合同:如果仅当经理偷懒且自然状态出现不利时才变得无法支付红利,则如果规定当企业红利降低时将解雇代理人,代理人将会努力工作。,博弈论2009,正大光明 公正無私 幫助別人 成就自己,112,全盘出售:经理通过杠杆收购买入企业。 效率工资:为了使他害怕失去工作,给CEO支付超出他能力的工资。 锦标制度:几个副总裁进行竞争,胜者将会继任总裁。 监督:董事长雇用顾问来评价经理业绩。 重复:在经理的大部分工作生涯中,他的工资低于边际产品,但如果保持良好工作记录的话,他以后会得到高薪或丰厚的退休金。 转变代理人类型:年长的经理通过对工作热情及辛勤工作给予称赞来

44、鼓励年青人。,博弈论2009,正大光明 公正無私 幫助別人 成就自己,113,2.隐藏行动的道德风险 Moral hazard with hidden action 博弈开始时,代理人和委托人拥有对称信息并达成合同。 但随后代理人选择了某个未被委托人观察到的行动。 代理人先于自然行动。 信息是完全的。,博弈论2009,正大光明 公正無私 幫助別人 成就自己,114,P 委托人 A 代理人 N 自然,博弈论2009,正大光明 公正無私 幫助別人 成就自己,115,应用,博弈论2009,正大光明 公正無私 幫助別人 成就自己,116,生产博弈 局中人:经理,工人 博弈顺序: 经理知道工人的能力而不

45、知道努力程度 根据能力提供给工人工资w; 工人决定接受或拒绝合同; 如果代理人接受,他提供努力e; 产出为q(e),且q0。,博弈论2009,正大光明 公正無私 幫助別人 成就自己,117,支付: 如果工人拒绝合同,则 工人U0, 经理0 如果工人接受合同,则 工人U(e,w), 经理V(q-w) 其中: U、V分别为工人和经理的效用函数, U0为工人保留效用。,博弈论2009,正大光明 公正無私 幫助別人 成就自己,118,百老汇博弈:最优合同 局中人:投资人,制作人 博弈顺序: 投资人提供基于收益q的工资合同w(q); 制作人决定接受或拒绝合同; 制作人选择贪污或不贪污; 自然以相等的概率

46、选择成功或失败。,博弈论2009,正大光明 公正無私 幫助別人 成就自己,119,最终收益q:,电影:金牌制作人,Mel Brook,1968,博弈论2009,正大光明 公正無私 幫助別人 成就自己,120,支付: 制作人为风险规避者,而投资人为风险中性者。 如果制作人拒绝合同,其所获支付为U(100) ,其中U0且U”0,同时投资人所获支付为0。否则 U(w(q)+50),如果贪污 制作人 U(w(q),如果不贪污 投资人q-w(q),博弈论2009,正大光明 公正無私 幫助別人 成就自己,121,油锅合同:boil-in-oil contract w(+500)=100; w(-100)=

47、100; w(+100)=- 同时满足无风险工资与有效激励。 酬劳投入而不是产出,报酬与结果分离。 法律启示: 不应该简单地使惩罚与危害相匹配。 很少实施的高惩罚将会提供合适的激励而同时又能保持低成本,尽管不幸的违反者受到与他们造成的危害远不成比例的惩罚。,博弈论2009,正大光明 公正無私 幫助別人 成就自己,122,保险博弈:防范程度可观测* 局中人:史密斯,两个保险公司 博弈顺序: 史密斯选择“细心防范”或“粗心防范”,行动被保险公司观测到。 保险公司1、2分别提供合同(x,y),其中x为保费,y为失窃赔偿。 史密斯选择一个合同。 自然选择是否失窃,“细心防范”下失窃概率为0.5; “粗

48、心防范”下失窃概率为0.75。,博弈论2009,正大光明 公正無私 幫助別人 成就自己,123,支付:(车价12;细心防范保费6;粗心防范保费9; 粗心倾向) 史密斯风险规避,保险公司风险中性。未被选中的公司得到0支付。 史密斯的效用函数U满足U0及U0。在合同(x,y)下的支付: “细心防范”下: 史密斯0.5U(12-x)+0.5U(0+y-x) 公司0.5x+0.5(x-y) “粗心防范”下: 史密斯0.25U(12-x)+0.75U(0+y-x)+ 公司0.25x+0.75(x-y),博弈论2009,正大光明 公正無私 幫助別人 成就自己,124,分析:对称信息; 均衡为选择“细心防范”;充分保险。 保险博弈 :防范程度不可观测* 发生的条件: 公司无法观测到史密斯的行动; 国家保险委员会不允许合同强制史密斯“细心防范”; 证实“粗心防范”的成本很高。,博弈论2009,正大光明 公正無私 幫助別人 成就自己,125,博弈顺序: 保险公司1、2分别提供合同(x,y),其中x为保费,y为失窃赔偿

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 其他


经营许可证编号:宁ICP备18001539号-1