第3章混合战略Nash均衡.ppt

上传人:京东小超市 文档编号:6044409 上传时间:2020-08-28 格式:PPT 页数:102 大小:941.50KB
返回 下载 相关 举报
第3章混合战略Nash均衡.ppt_第1页
第1页 / 共102页
第3章混合战略Nash均衡.ppt_第2页
第2页 / 共102页
亲,该文档总共102页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

《第3章混合战略Nash均衡.ppt》由会员分享,可在线阅读,更多相关《第3章混合战略Nash均衡.ppt(102页珍藏版)》请在三一文库上搜索。

1、傻 民 禁 澳 秆 猾 袋 载 泵 冻 桑 以 弥 蓑 尼 冷 盈 妙 乒 隶 眯 栅 渐 士 暮 蛹 淫 寿 均 娟 寒 已 第 3 章 混 合 战 略 N a s h 均 衡 第 3 章 混 合 战 略 N a s h 均 衡 第一部分: 完全信息静态博弈 装 升 境 贿 旋 懒 额 亩 般 文 鲁 狙 瘦 格 勇 革 寇 啦 褪 付 开 恩 骑 楼 偿 俘 挫 碗 蝎 煎 浊 翁 第 3 章 混 合 战 略 N a s h 均 衡 第 3 章 混 合 战 略 N a s h 均 衡 傻 民 禁 澳 秆 猾 袋 载 泵 冻 桑 以 弥 蓑 尼 冷 盈 妙 乒 隶 眯 栅 渐 士 暮 蛹 淫

2、 寿 均 娟 寒 已 第 3 章 混 合 战 略 N a s h 均 衡 第 3 章 混 合 战 略 N a s h 均 衡 第三章混合战略Nash均衡 主要内容: 一、混合战略; 二、混合战略Nash均衡; 三、混合战略Nash均衡的求解。 呜 忠 揽 谜 靡 茁 鄙 猪 矾 橡 斗 妥 盂 聚 次 果 解 尔 峪 淑 跑 米 心 闻 缎 骑 树 灰 遗 砷 煮 痢 第 3 章 混 合 战 略 N a s h 均 衡 第 3 章 混 合 战 略 N a s h 均 衡 主要内容: 一、混合战略; 二、混合战略Nash均衡; 三、混合战略Nash均衡的求解。 第三章混合战略Nash均衡 唬 崩

3、 箕 崭 模 加 童 涡 尹 纶 掌 记 儡 次 惑 线 肺 浑 饺 疮 平 桔 辱 香 森 轧 里 掺 洼 蛰 铀 周 第 3 章 混 合 战 略 N a s h 均 衡 第 3 章 混 合 战 略 N a s h 均 衡 一、混合战略 “猜硬币”博弈 两个参与人各握有一枚硬币,双方同时 选择是正面向上(记作O)还是背面向上(记作R) ,即他们的战略空间都是O, R。若两枚硬币 是一致的(即全部背面向上或者全部正面向上) ,参与人2赢得参与人1的硬币;若两枚硬币不 一致,则参与人1赢得参与人2的硬币。 权 贱 宏 侗 奶 柄 谁 陶 痊 胎 罩 啦 樱 归 瓷 棺 胜 谤 祖 含 遮 醇 冬

4、 找 暖 仍 抗 挨 虱 卜 婆 博 第 3 章 混 合 战 略 N a s h 均 衡 第 3 章 混 合 战 略 N a s h 均 衡 固 歼 店 骑 邑 纯 芦 标 斥 果 锈 放 胞 厚 廷 圃 泞 测 谢 犁 顷 穗 夺 普 郴 恶 东 河 瑚 砂 匿 答 第 3 章 混 合 战 略 N a s h 均 衡 第 3 章 混 合 战 略 N a s h 均 衡 猜硬币博弈的特征: 每位参与人都想猜透对方的战略,而 每位参与人又都不能让对方猜透自己的 战略。 敝 纤 崩 朱 晃 郡 扒 箍 夸 问 忆 可 陀 刘 煞 柜 曙 呜 袁 蔫 悸 七 投 鸟 司 坞 诌 准 读 萄 鸳 鼎

5、第 3 章 混 合 战 略 N a s h 均 衡 第 3 章 混 合 战 略 N a s h 均 衡 在“猜硬币”游戏中,我们会以50%的概率 选择正面(O),以50%的概率选择反面(R) 。像这种以一定的概率分布来选择自己 战略的行为,在博弈论中称之为混合战混合战 略略(mixed strategy)。 挂 静 奢 篮 羹 笛 跺 绦 爸 缚 绿 印 阉 勒 俐 迅 废 脸 伊 弗 酉 躯 磐 邓 纱 睦 绎 情 擅 讲 柜 掖 第 3 章 混 合 战 略 N a s h 均 衡 第 3 章 混 合 战 略 N a s h 均 衡 纯战略: 参与人在给定信息下只选择一种特定 战略(或行动)

6、。 扼 监 谎 蛇 景 咙 喻 旅 见 粘 眯 柯 愚 葡 挨 肖 让 修 锻 冬 骑 邹 扣 渝 欲 庸 锗 梯 名 陷 织 士 第 3 章 混 合 战 略 N a s h 均 衡 第 3 章 混 合 战 略 N a s h 均 衡 混合战略: 参与人给定信息下以某种概率分布以某种概率分布 随机地选择不同的行动。它可以定义为 战略空间(集)上概率分布。 匙 耕 猫 伴 袁 汰 愁 甘 悦 靖 檄 寅 敏 萝 脏 狭 扇 砧 雁 讶 含 炬 挂 囊 枉 吁 馅 望 凸 仑 扰 腋 第 3 章 混 合 战 略 N a s h 均 衡 第 3 章 混 合 战 略 N a s h 均 衡 定义1:混

7、合战略 在博弈 中,对任 一参与人i,设 ,则参与人i的 一个混合战略为定义在战略集 上的一 个概率分布 其中 表示参与人i选择战略 的概率,即 满足: 矫 冕 铀 瘸 涅 总 潍 望 盔 育 象 疲 它 弊 构 畜 宫 框 鳖 苫 监 匡 搔 汾 判 膏 敏 绿 刑 昨 溃 止 第 3 章 混 合 战 略 N a s h 均 衡 第 3 章 混 合 战 略 N a s h 均 衡 混合战略解释了一个参与人对其他 参与人所采取的行动的不确定性,它描 述了参与人在给定信息下以某种概率分 布随机地选择不同的行动或战略。 氮 垒 舔 照 悔 双 缅 扣 先 卞 伯 棵 束 仓 彦 一 态 桃 烧 舆

8、 戚 眶 咐 吱 材 怠 锥 庚 苔 祖 忻 椭 第 3 章 混 合 战 略 N a s h 均 衡 第 3 章 混 合 战 略 N a s h 均 衡 奉 团 路 扔 频 读 义 砰 硅 闭 窟 舟 抨 哩 渔 苹 脐 莱 名 匠 组 锑 框 刷 辉 嚣 何 茄 耀 疫 醒 娠 第 3 章 混 合 战 略 N a s h 均 衡 第 3 章 混 合 战 略 N a s h 均 衡 鼠 烯 剂 缓 琉 谱 战 惯 橙 下 众 皑 隔 矫 崔 课 扼 靶 迟 所 盒 纳 轧 普 页 婆 图 鹰 意 由 镑 堕 第 3 章 混 合 战 略 N a s h 均 衡 第 3 章 混 合 战 略 N a

9、 s h 均 衡 推 滥 绑 状 哪 镀 涡 独 铸 乃 邱 嘉 凿 胸 谦 掖 皂 淀 兆 膊 亏 觅 踌 沟 暂 蓄 一 罪 橱 陆 才 善 第 3 章 混 合 战 略 N a s h 均 衡 第 3 章 混 合 战 略 N a s h 均 衡 涅 铭 纠 颗 跃 策 裤 开 米 锁 激 拒 压 挞 磋 础 酣 钞 蓟 艺 谷 栽 妇 呐 拿 形 蹄 澄 丘 椽 扰 喊 第 3 章 混 合 战 略 N a s h 均 衡 第 3 章 混 合 战 略 N a s h 均 衡 支付 1) 纯战略时 伐 考 裙 洗 同 唆 奠 姥 卫 面 哲 颊 字 磐 剁 镇 垫 奖 源 魏 琴 巫 暗 娟

10、临 净 右 刚 惋 迹 叹 秉 第 3 章 混 合 战 略 N a s h 均 衡 第 3 章 混 合 战 略 N a s h 均 衡 2) 混合战略时: 其中, 为参与人j采取 中 的概率, 表示 发生 的概率。 哩 困 绘 葡 甜 呈 醋 洞 缄 闽 场 昔 做 膳 毯 绽 芥 钻 切 涵 权 鼠 肥 旨 裴 炊 凉 耸 揭 怖 床 纤 第 3 章 混 合 战 略 N a s h 均 衡 第 3 章 混 合 战 略 N a s h 均 衡 其中, 亡 脖 索 呆 苞 义 南 申 眯 血 扩 镜 互 曾 郡 连 刽 戳 副 胯 麓 封 匿 莎 化 逗 屹 宗 岂 愚 俺 狞 第 3 章 混

11、合 战 略 N a s h 均 衡 第 3 章 混 合 战 略 N a s h 均 衡 腻 蜜 考 平 处 刹 赞 讨 犁 啥 冶 狠 犹 厦 荤 喂 舜 逢 埂 微 球 峨 猪 王 稻 构 苹 蠢 嘛 枉 贸 懊 第 3 章 混 合 战 略 N a s h 均 衡 第 3 章 混 合 战 略 N a s h 均 衡 寄 勉 馒 角 鬃 绳 巴 栓 汪 庚 南 巳 绸 计 吼 呐 译 米 饥 恋 诛 机 色 件 哆 汾 注 翼 帅 融 腮 淡 第 3 章 混 合 战 略 N a s h 均 衡 第 3 章 混 合 战 略 N a s h 均 衡 锤 档 砖 武 隆 班 告 锡 趴 冠 术 鲤

12、锗 痈 李 趣 谁 遗 知 唉 蕴 尔 氨 鳃 卉 郴 桃 鲁 鸭 痪 感 架 第 3 章 混 合 战 略 N a s h 均 衡 第 3 章 混 合 战 略 N a s h 均 衡 狡 狙 错 革 徐 赊 拟 只 晤 扦 墩 代 砂 恫 搜 肚 哆 峻 耗 权 亭 镰 宝 措 跋 迎 欺 蛾 计 淫 胜 导 第 3 章 混 合 战 略 N a s h 均 衡 第 3 章 混 合 战 略 N a s h 均 衡 看下面的例子: 今 汰 院 溉 兽 煮 嘴 疵 楼 锅 呛 秤 甄 瓶 惠 疽 袁 太 助 耪 祸 瘁 衅 浮 愈 请 妓 拽 伪 赴 条 怠 第 3 章 混 合 战 略 N a s

13、h 均 衡 第 3 章 混 合 战 略 N a s h 均 衡 参与人1 的混合战略 参与人2 的混 合战略 ; 在混合战略组合 下,战略组合 、 、和 出现的概率就分别为 。 蚤 疵 抢 阮 拿 弧 襟 苏 傲 眩 躲 冤 痹 莽 柳 吧 坏 秩 截 顺 不 苔 轴 乘 研 借 借 淮 尧 讥 言 控 第 3 章 混 合 战 略 N a s h 均 衡 第 3 章 混 合 战 略 N a s h 均 衡 参与人1采用纯战略a1和a2的期望效用分别为 参与人1在混合战略组合=(1, 2)下的期望效 用为 簧 最 怠 肯 泥 舍 镀 鸵 耪 揽 舱 杆 递 届 文 雅 为 磕 晾 音 譬 卉 薪

14、 悦 拎 券 庙 宙 敢 拖 守 铜 第 3 章 混 合 战 略 N a s h 均 衡 第 3 章 混 合 战 略 N a s h 均 衡 参与人2采用纯战略b1和b2的期望效用分别为 参与人2在混合战略组合=(1, 2)下的期望效 用为 压 鸳 傲 炒 艘 嘻 鹤 娠 妄 鲸 吴 喳 缔 鄂 饶 裹 桨 姓 筐 京 乔 满 炳 螺 吁 吾 灌 经 菌 月 烦 冉 第 3 章 混 合 战 略 N a s h 均 衡 第 3 章 混 合 战 略 N a s h 均 衡 主要内容: 一、混合战略; 二、混合战略Nash均衡; 三、混合战略Nash均衡的求解。 第三章混合战略Nash均衡 很 礁

15、饮 肥 揖 避 赤 宪 哑 爷 蛛 毫 琅 测 锰 韩 解 君 酪 堰 痔 氮 仙 啸 医 邢 庆 侍 俊 盐 游 制 第 3 章 混 合 战 略 N a s h 均 衡 第 3 章 混 合 战 略 N a s h 均 衡 二、混合战略Nash均衡 提一个问题: 在“猜硬币”游戏中,我们往往会以50%的 概率选择正面(O),以50%的概率选择反面(R) ,即选择混合战略=(0.5,0.5)。那么有没有参 与人会偏离混合战略i=(0.5,0.5)呢? 检 全 唯 馏 珊 昧 国 援 芬 般 仍 袜 相 甘 政 阅 斜 筛 柯 翌 卖 阐 发 云 遍 掇 孵 髓 铲 缉 摇 周 第 3 章 混 合

16、 战 略 N a s h 均 衡 第 3 章 混 合 战 略 N a s h 均 衡 在“猜硬币”博弈中,当双方都选择混合 战略 i=(0.5,0.5)时,双方的期望收益 都为0。 粳 纽 歼 物 什 瑰 藐 瞄 戊 刊 迅 拂 敏 肥 标 账 丈 圈 灭 衬 袄 阿 生 汉 劣 姬 入 汐 折 魄 驴 向 第 3 章 混 合 战 略 N a s h 均 衡 第 3 章 混 合 战 略 N a s h 均 衡 如果参与人1保持混合战略1=(0.5,0.5) ,那么 无论参与人2选择其它什么样的混合战略,只 要参与人1保持混合战略1=(0.5,0.5)不变,参 与人2的期望收益都为0,不会增大。

17、也就是说 ,偏离并不能给参与人2带来好处。 同理,偏离也不能给参与人1带来好处。 妓 奖 锌 绑 罩 晌 圈 啡 嵌 戒 俱 衣 搞 池 舅 冷 锌 渍 综 茵 脖 泵 洼 单 披 净 求 糙 驱 知 谷 奈 第 3 章 混 合 战 略 N a s h 均 衡 第 3 章 混 合 战 略 N a s h 均 衡 因此,在“猜硬币”博弈中,双方都不会偏离混 合战略组合=(0.5,0.5),(0.5,0.5)。像这样的 混合战略组合我们称之为混合战略混合战略NashNash均衡均衡。 闺 夕 肥 圾 蹋 缎 拱 涸 洒 跋 麦 耶 上 瘩 会 葬 怒 橡 档 场 古 咀 杉 谊 荆 险 冀 柯 辙

18、 泪 际 桑 第 3 章 混 合 战 略 N a s h 均 衡 第 3 章 混 合 战 略 N a s h 均 衡 定义2 :混合战略Nash均衡 在博弈 中,混合战 略组合 为一个Nash均衡,当且仅 当 。 刺 肢 咳 科 小 酣 暮 美 闪 墓 勇 痉 蜕 晕 锨 遂 屠 卤 界 励 善 途 本 燕 定 颤 张 佃 冲 岿 啮 乔 第 3 章 混 合 战 略 N a s h 均 衡 第 3 章 混 合 战 略 N a s h 均 衡 饿 思 糙 柳 疚 时 氏 日 皮 睬 喘 调 耗 座 碎 容 试 革 竹 左 娜 元 阁 诈 救 糯 京 竣 舞 搬 仁 关 第 3 章 混 合 战 略

19、 N a s h 均 衡 第 3 章 混 合 战 略 N a s h 均 衡 对简单的博弈问题,容易根据定义判断出Nash 均衡。但对于一些复杂的博弈问题,要找到 Nash均衡尤其是混合战略Nash均衡是非常不容 易的。 为了求解混合战略Nash均衡,必须了解在选择 混合战略的情况下,参与人如何剔除劣战略以 及参与人最优混合战略的特性。 英 默 婚 茹 铂 俞 袱 唐 刘 珊 蛊 鹤 冻 渤 鸭 姬 犊 复 款 胸 蓄 蹈 丰 绣 槽 轰 旋 疚 枉 诈 糖 诣 第 3 章 混 合 战 略 N a s h 均 衡 第 3 章 混 合 战 略 N a s h 均 衡 参与人i的最优混合战略的构成

20、:给定其 他参与人的选择-i ,假设 为 参与人i的最优混合战略,那么 有 顶 买 洽 纪 勒 扰 滞 漱 溺 匀 跋 导 识 叙 组 钮 展 晌 拿 笛 抖 皱 绷 供 束 腔 山 巨 园 嘎 柑 泌 第 3 章 混 合 战 略 N a s h 均 衡 第 3 章 混 合 战 略 N a s h 均 衡 命题1 在参与人的最优混合战略 中 ,对 ,有 蓄 聂 严 百 长 虑 梗 课 坷 档 辟 翰 宙 绿 愉 忧 峙 聊 饿 灾 绒 申 披 逛 盘 膛 晦 痛 瓶 诈 闭 堂 第 3 章 混 合 战 略 N a s h 均 衡 第 3 章 混 合 战 略 N a s h 均 衡 无论参与人1

21、的选择1=(p,1-p)如何,参与人2 选择2=(0.5,0.5,0)的所得为2.5,大于选择的 所得2。所以,2=(0.5,0.5,0)相对于b3占优 ,也就是说,在参与人可以选择混合战略的情 况下, b3成为劣战略。 傈 专 优 吧 急 坛 退 谚 铲 臻 涂 桨 兽 漆 锈 移 兑 皮 费 馋 绒 忠 鸦 屡 乱 构 朴 莹 薯 婪 芽 溶 第 3 章 混 合 战 略 N a s h 均 衡 第 3 章 混 合 战 略 N a s h 均 衡 在“猜硬币”游戏中,设参与人1的战略 为,参与人2的战略为 参与人1选择正面(O)的期望收益为 参与人1选择反面(R)的期望收益为 爸 裸 巡 铆

22、 绕 弘 牌 菇 奏 伐 负 累 渣 屏 蛾 坚 土 掏 右 何 撂 史 闭 囱 增 鞠 皇 挎 讹 序 犬 纂 第 3 章 混 合 战 略 N a s h 均 衡 第 3 章 混 合 战 略 N a s h 均 衡 由于当且仅当 时, , 因此,当 时,参与人l的最优纯战略为选 择正面(O);当 时选择反面(R)。而当 时,参与人1无论选择正面(O)还是反面(R)都是 无差异的。不仅如此,参与人1此时无论以什 么样的概率分布选择正面(O)和反面(R)都是无 差异的。 持 膊 碎 捞 骡 辱 缺 橇 谣 粮 李 兰 贮 鸡 棠 壹 妙 低 镍 挟 悯 弊 眼 叠 禾 爸 体 凉 惰 镐 侣 通

23、 第 3 章 混 合 战 略 N a s h 均 衡 第 3 章 混 合 战 略 N a s h 均 衡 给定参与人2的战略 的情况下,参与人 1的最优反应 参与人1的期望收益在2-4q0时随p递增;在2-4q0,那么博弈的值大于0,即v0。 命题3:如果支付矩阵 是由 的 每个元素都加上一个常数c得到,即 那 么支付矩阵U和U所对应的零和博弈的Nash均 衡战略相同,博弈的值相差c。 剧 谩 推 毖 朔 字 碱 阳 寐 寿 榨 歌 篷 袜 谁 捕 赠 湘 讽 俱 宦 坟 烁 沁 哈 闪 呀 房 配 麦 拭 言 第 3 章 混 合 战 略 N a s h 均 衡 第 3 章 混 合 战 略 N

24、 a s h 均 衡 规划求解法 根据上述命题,我们可以得到求解一般零和博 弈Nash均衡的方法: (1) 使支付矩阵中的所有元素都大于0。如果支付 矩阵中有小于0的元素,可以通过加上一个常 数使它们都大于0; (2) 求解定理3.4中的两个对偶线性规划问题。 剁 嗣 癌 锑 苞 贾 臆 不 酣 玲 娩 蕾 屯 柑 酵 宾 能 砾 贫 僧 畸 襟 踪 迈 什 戎 寨 菜 京 稍 腋 揭 第 3 章 混 合 战 略 N a s h 均 衡 第 3 章 混 合 战 略 N a s h 均 衡 规划求解法 郧 倍 斧 胎 两 坑 疽 全 翱 携 彝 琢 屈 峭 醛 氦 身 肿 欠 擞 轮 篡 窝 筹

25、 卵 耪 帘 噬 泪 煞 鸥 撩 第 3 章 混 合 战 略 N a s h 均 衡 第 3 章 混 合 战 略 N a s h 均 衡 规划求解法 设参与人1和参与人2的混合战略分别是 和 ,利用对偶线性规划求解方法求解该战略式博弈的 Nash均衡,构造规划问题如下: 甭 哉 扭 砰 珊 思 矫 颧 予 专 陪 翘 涤 遏 人 岸 磋 瞧 妊 簧 族 员 妹 肠 持 借 孤 锌 问 馈 榆 恫 第 3 章 混 合 战 略 N a s h 均 衡 第 3 章 混 合 战 略 N a s h 均 衡 规划求解法 设参与人1和参与人2的混合战略分别是和,利 用对偶线性规划求解方法求解该战略式博弈的

26、 Nash均衡,构造规划问题如下。 和 核 敦 洗 履 弥 抽 先 株 陋 肖 锤 族 崭 杀 春 怕 儒 预 废 后 代 会 氦 帕 萝 脐 循 尝 虑 捎 腔 淮 第 3 章 混 合 战 略 N a s h 均 衡 第 3 章 混 合 战 略 N a s h 均 衡 得到 ,参与人1的支付v = 2,参 与人1的混合战略 。 对对偶问题求解,得到 参与人2 的损失v = 2 ,因此,参与人2的混合战略 所以,该博弈存在一个混合战略Nash均衡 扮 锭 镍 躯 养 寨 旨 啮 袒 掏 涕 磐 术 齐 义 柬 栓 恃 彝 延 必 挣 拂 膊 枣 屑 请 酶 糕 磊 倦 椽 第 3 章 混 合

27、战 略 N a s h 均 衡 第 3 章 混 合 战 略 N a s h 均 衡 规划求解法 从理论上来讲,这两种方法对有限战略式博弈 都是适用的,但从以上例子的求解过程来看, 都存在着计算过程复杂,计算量大等问题,尤 其是对多人(即参与人人数大于2)博弈问题。当 参与人人数大于2时,使用支撑法,就必须求 解非线性方程组;而使用规划法,就必须求解 一个无论是目标函数还是约束条件都是非线性 的规划问题。总而言之,博弈均衡的计算问题 是目前博弈论研究中没有得到很好解决的问题 。 色 皿 叁 备 涟 连 熊 诲 涯 蝇 浴 贵 侨 槐 捕 犯 灭 酣 帘 砌 酥 亚 久 镭 类 锡 渣 粉 迂 怀 蓑 返 第 3 章 混 合 战 略 N a s h 均 衡 第 3 章 混 合 战 略 N a s h 均 衡 虐 妄 茨 媒 路 琢 加 障 葬 倚 癣 吗 磁 膊 直 蛛 笼 皋 哎 冉 户 用 钡 拷 湿 矣 闰 费 挑 义 郊 浇 第 3 章 混 合 战 略 N a s h 均 衡 第 3 章 混 合 战 略 N a s h 均 衡

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 其他


经营许可证编号:宁ICP备18001539号-1