03-混合策略纳什均衡.ppt

上传人:scccc 文档编号:11856722 上传时间:2021-10-01 格式:PPT 页数:27 大小:386.50KB
返回 下载 相关 举报
03-混合策略纳什均衡.ppt_第1页
第1页 / 共27页
03-混合策略纳什均衡.ppt_第2页
第2页 / 共27页
03-混合策略纳什均衡.ppt_第3页
第3页 / 共27页
03-混合策略纳什均衡.ppt_第4页
第4页 / 共27页
03-混合策略纳什均衡.ppt_第5页
第5页 / 共27页
点击查看更多>>
资源描述

《03-混合策略纳什均衡.ppt》由会员分享,可在线阅读,更多相关《03-混合策略纳什均衡.ppt(27页珍藏版)》请在三一文库上搜索。

1、1,3 混合策略纳什均衡,3.1 混合策略纳什均衡 3.2 多重纳什均衡博弈 3.3 多重纳什均衡博弈的分析,主要内容,2,猜硬币博弈,(1)不存在前面定义的纳什均衡策略组合 (2)关键是不能让对方猜到自己策略 这类博弈很多,引出混合策略纳什均衡概念,3.1 混合策略纳什均衡,3,行参与人,列参与人,混合策略:在博弈 中,博弈方 的策略空间为 ,则博弈方 以概率分布 随机在其 个可选策略中选择的“策略”,称为一个“混合策略”,其中 对 都成立,且,4,混合策略扩展博弈:博弈方在混合策略的策略空间(概率分布空间)的选择看作一个博弈,就是原博弈的“混合策略扩展博弈。,设行参与人的策略选择概率为 ,

2、列参与人的策略选择概率为,5,注意:在纳什均衡下,没有参与人有积极性单独偏离或改变该策略或策略组合。,6,例1,假设政府救济的概率为 ;流浪汉找工作的概率为 ; 则,7,策略 得益 博弈方1 (0.8,0.2) 2.6 博弈方2 (0.8,0.2) 2.6,例2,8,例3 扑克牌对色游戏,假设A出红牌的概率为 ;B出红牌的概率为 ;则,因此A的最佳反应函数为,9,因此A的最佳反应函数为,同理,纳什均衡是:A和B出红牌还是出黑牌的概率都是1/2.,反应函数法,10,练习1:利用反应函数法找出政府与流浪汉博弈的纳什均衡,假设政府救济的概率为 ;流浪汉找工作的概率为 ; 则,11,纳什均衡是:政府以

3、1/2的概率选择救助,流浪汉以1/5的概率选择找工作。,练习2:利用反应函数法找出情侣博弈的所有纳什均衡,12,例4 (激励的悖论)有一家公司为了防止盗窃聘请了一名门卫,但是长期以来却发现仍有盗窃案件发生,公司讨论了两种方案,一是只要有失窃案件,则加重惩罚门卫,另一方案是,只要抓住小偷,则联合公安机关加重对小偷的惩罚。请分析哪种方法对降低盗窃率有长效作用?,假设小偷选择偷的概率为 ;守卫选择睡觉的概率为 ;则,13,加重对守卫的处罚:短期中的效果是使守卫尽职 在长期中并不能使守卫更尽职,但会降低盗窃发生的概率,分析得到纳什均衡,14,加重对小偷的处罚:短期内能抑制盗窃发生率 长期并不能降低盗窃

4、发生率,但会使得守卫更多的偷懒睡觉,15,监督博弈的纳税检查,A 为应纳税款,C为检查成本, F是偷税罚款。假定 CA+F。不存在纯战略纳什均衡。请问:如何才能降低纳税人逃税的可能性,税收机关 检查 不检查,纳税人 逃税 不逃税,16,1)夫妻之争的混合策略纳什均衡,夫妻之争博弈的混合策略纳什均衡 策略 得益 丈夫 (2/3,1/3) 2/3 妻子 (1/3,2/3) 2/3,3.2 多重纳什均衡博弈,17,2)制式问题,制式问题混合策略纳什均衡 A B 得益 厂商1: 0.4 0.6 0.664 厂商2: 0.67 0.33 1.296,18,3)市场机会博弈,进 不进 得益 厂商1: 2/

5、3 1/3 0 厂商2: 2/3 1/3 0,19,帕累托上策均衡 风险上策均衡 聚点均衡 相关均衡 抗共谋均衡,3.3 多重纳什均衡博弈的分析,20,1)帕累托上策均衡,(鹰鸽博弈) 这个博弈中有两个纯策略纳什均衡,(战争,战争)和(和平,和平),显然后者帕累托优于前者,所以,(和平,和平)是本博弈的一个帕累托上策均衡。,21,2)风险上策均衡,考虑、顾忌博弈方、其他博弈方可能发生错误等时,帕累托上策均衡并不一定是最优选择,需要考虑:风险上策均衡。下面就是两个例子。,22,帕累托标准与风险优势的判断,设定均衡(鹿,鹿)为A纳什均衡,(兔,兔)为B纳什均衡,甲离A损失乙离A损失36 甲离B损失

6、乙离B损失=16,对于第一个博弈,,甲离A损失乙离A损失4 甲离B损失乙离B损失=9,对于第二个博弈,,23,3)聚点均衡,利用博弈设定以外的信息和依据进行选择的均衡 文化、习惯或者其他各种特征都可能是聚点均衡的依据 城市博弈(城市分组相同)、时间博弈(报出相同的时间)是聚点均衡的典型例子,24,4)相关均衡,三个纳什均衡: (U,L)、(D,R) 和混合策略均衡(1/2,1/2),(1/2,1/2) 结果都不理想,不如(D,L)。,可利用聚点均衡(天气,抛硬币),但仍不理想。,相关装置: 1、各1/3概率A、B、C 2、博弈方1看到是否A,博弈方2看到是否C 3、博弈方1见A采用U,否则D;

7、博弈方2见C采用R,否则L。,相关均衡要点: 1、构成纳什均衡 2、有人忽略不造成问题,25,5)防联盟均衡,博弈中若有三个及三个以上的局中人,就有可能部分人结成“联盟”,在极大化联盟成员利益的同时损害了其他局中人的利益。,(U,L,A)、(D,R,B)纯策略纳什均衡 (U,L,A) Pareto优于(D,R,B),26,(U,L)、(D,R)纳什均衡,(D,R) Pareto 最优均衡,(D,R,B)有效地防止了甲乙二人可能的联盟,避免了丙的损失。在防联盟均衡这一层意义上,(D,R,B)优于(U,L,A)。,甲与乙组成一个联盟与丙博弈,联盟的一方互相协调,尽可能地极大化联盟各个成员的赢利。,这时甲乙两人条件博弈的最优均衡仍是(D,R),设(U,L,A)是博弈的预测解,让丙固定于A,则甲、乙两人之间的条件赢得矩阵为,27,从甲 的角度看,不管乙与丙是否结盟,条件博弈的均衡仍为(L,A),不违背原博弈的均衡(U,L,A)。,对博弈的预测需要从整体出发,防联盟均衡应全面考虑。 固定任何一个局中人的策略选择,其他局中人将协调在条件博弈的最优均衡上。 如果协调的结果偏离了原纳什均衡,则该纳什均衡不能成为合理预测。,多人博弈中,如果存在多重纯策略均衡,任何k人联盟都不会发生背离现象的均衡是一个合理预测,符合这种推理的预测结局称为防联盟均衡。,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 社会民生


经营许可证编号:宁ICP备18001539号-1