经济博弈论ppt课件.ppt_三一文库31doc.com

资源描述

《经济博弈论ppt课件.ppt》由会员分享，可在线阅读，更多相关《经济博弈论ppt课件.ppt（334页珍藏版）》请在三一文库上搜索。

1、经济博弈论,陈新燕,本课程主要内容,第一章导论第二章完全信息静态信息博弈-纳什均衡第三章完全且完美信息动态搏弈-子博弈精炼纳什均衡第四章重复博弈第六章完全但不完美信息动态博弈完美贝叶斯均衡第七章不完全信息静态博弈-贝叶斯纳什均衡第八章不完全信息动态博弈-精练贝叶斯纳什均衡,第一章导论,本章首先介绍博弈论的发展历史及其重要性，然后介绍博弈论的基本概念，包括什么是博弈和博弈论，给出一些经典博弈例子。对博弈分类和博弈理论的结构作一些讨论。目标是让读对博弈论的内容和博弈模型有更直观的概念和印象，本教材的基本内容，以及博弈分析的基本思想方法等形成初步的认识，为后面各章展开详细

2、分析作好铺垫和准备。,第一章导论,1. 1博弈论的历史和发展 1. 2博弈论的重要性 1. 3博弈论的基本概念 1. 4博弈论的分类,1.1博弈的历史和发展,1.1.1博弈论的早期研究 1.1.2博弈论的形成 1.1.3博弈论的成长和发展 1.1.4博弈论的成熟及与主流经济学的融合,1.1.1博弈论的早期研究,2000年前我国古代“孙子兵法”、“孙膑兵法” 、“齐威王田忌赛马”，印度“摩诃婆罗多”，西方“圣经” 1500年前巴比伦犹太教法典“婚姻合同问题”等。 1838年古诺寡头模型。 1883年伯特兰德寡头竞争模型。 1913年齐默罗象棋博弈定理、“逆推归纳法” 1921-1927年波雷

3、尔给出混合策略的第一个现代表述，有数种策略两人博弈的极小化极大解 1928年诺伊曼和摩根斯坦给出扩展形博弈定义，证明有限策略两人零和博弈有确定结果,1.1.2博弈论的形成,冯.诺伊曼和摩根斯坦博弈论和经济行为（合作博弈） Theory of Games and Economic Behavior 1944 引进扩展形（extensive form）表示和正规形（normal form）或称策略形（strategy form）、矩阵形（matrix form）表示提出预期效用理论提出稳定集（stable sets）解概念正式提出创造博弈论一般理论的主意给出博弈论研究的一般框架、概念术语和

4、表述方法,1.1.3 博弈论的成长和发展一、第一个研究高潮，本世纪40年代末和50年代初,1952-1953年期间（L. S. Shapley）和（D. B. Gillies）提出“核”（Core）作为合作博弈的一般解概念 Shapley提出了合作博弈的“Shapley值”（Shapley value）概念等 1950年纳什提出“纳什均衡”（Nash equilibrium）概念和证明纳什定理，发展非合作博弈的基础理论。 1950年塔克定义了“囚徒困境”（Prisons dilemma）博弈；,二、50年代中后期一直到70年代博弈论发展的青年期,塞尔腾(Selten)1965提出“子博弈完美

5、纳什均衡”(subgame perfect Nash equilibrium) 1975年提出的“颤抖手均衡”(Trembling hand perfect equilibrium) 海萨尼(Harsanyi)1967-1968三篇构造不完全信息博弈理论的系列论文，“贝叶斯纳什均衡”(Bayesian Nash equilibrium)。海萨尼1973年提出关于“混合策略”的不完全信息解释，以及“严格纳什均衡”(Strict Nash equilibrium)。 70年代“进化博弈论”（Evolutionary game theory）的重要发展，（John Maynard Smith）19

6、72年引进“进化稳定策略”（ Evolutionarily stable strategy，ESS）等。 “共同知识”（Common knowledge）的重要性，因为奥曼1976年的文章引起广泛的重视。,1.1.4博弈论的成熟 80、90年代是博弈论走向成熟的时期,1981（Elon Kohlberg） “顺推归纳法”（Forward induction）克瑞泼斯（David M. kreps）和威尔孙（Robert Wilson）1982年提出“序列均衡”（Sequential equilibria） 1982年斯密（John Maynard Smith）出版了进化和博弈论（） 1984

7、年由伯恩海姆（B. D. Bernheim）和皮尔斯（D. G. Pearce）提出“可理性化性”（Rationalizability）海萨尼和塞尔腾1988年提出了在非合作和合作博弈中均衡选择的一般理论和标准， 1991年弗得伯格（D. Fudenberg）和泰勒尔（J. Tirole）首先提出了“完美贝叶斯均衡”（Perfext Bayesian equilibrium）的概念,1.2博弈论的重要性一、博弈论和经济学诺贝尔奖,1994：非合作博弈：纳什(Nash)、海萨尼（Harsanyi）、塞尔顿（Selten） 1996：不对称信息激励理论：莫里斯（Mirrlees）和维克瑞（Vi

8、ckrey） 2001：不完全信息市场博弈：阿克罗夫（Akerlof）（商品市场）、斯潘塞（Spence）（教育市场）、斯蒂格里兹（Stiglitze）（保险市场） 2002：实验经济学：史密斯（Smith），心理经济学：卡尼曼（Kahneman） 2005：冲突和合作：罗伯特奥曼（Robert J.Aumann）和托马斯谢林（Thomas C.Schelling,二、博弈论的广泛应用性,游戏下棋、猜大小经济厂商产量决策、市场阻入、投标拍卖政治、军事美国和伊拉克、以色列和巴勒斯坦,三、经济学家的名句,诺贝尔经济学奖获得者萨缪尔森有一句话：你可以将一只鹦鹉训练成一个经济学家，因为它只需要学习

9、两个词：供给和需求。博弈论专家坎多瑞引申说：要成为现代经济学家，这只鹦鹉必须再多学一个词，就是“纳什均衡”。张维迎认为：“近几十年来，经济学一直在为其他学科提供武器，但恐怕没有任何其他工具比博弈论更有力了”。,1.3博弈论的基本概念,1.3.1 博弈论的定义 1.3.2 博弈论的基本概念,1.3.1 博弈论的定义,博弈论（game theory，又译为对策论，游戏论）定义：博弈就是一些个人、队组或其他组织，面对一定的环境条件，在一定的规则下，同时或先后，一次或多次，从各自允许选择的行为或策略中进行选择并加以实施，各自取得均衡结果的过程。,1.3.1 博弈论的定义,例：囚徒困境,-5， -

10、5,0， -8,-8， 0,-1， -1,坦白,不坦白,坦白,不坦白,两个罪犯的得益矩阵,囚徒 2,1.3.2博弈论的基本概念,参与人（player）：一个博弈中的决策主体，他的目的是通过选择策略以最大化自己的支付（效用水平）。参与人可能是自然人，也可能是团体，如企业、国家甚至可能是若干个国家组成的集团。虚拟参与人（pseudo-player）:决定外生的随机变量分布的机制，也称自然”natuer”。用i=1,2,n代表，用N代表虚拟参与人；,1.3.2博弈论的基本概念,不开发,开发商A,开发,不开发,开发,不开发,开发商B,开发商A,开发,不开发,开发,开发商B,需求小的情况,需求大

11、的情况,1.3.2博弈论的基本概念,行为（actions）:每个博弈方在进行决策时，可以选择的方法、做法或经济活动的水平、量值等。用ai表示第i个参与人的一个特定行动。用a=(a1 ,ai ,ai )表示n个参与人的行动的有序集行动顺序：博弈方做出决策的先后顺序。,1.3.2博弈论的基本概念,策略（strategies）：参与人在给定信息集的情况下的行动规则，它规定参与人什么时候选择行动。用si表示第i个参与人的一个特定策略。用s=(s1 ,si ,si )表示n个参与人的策略的有序集在静态博弈中，策略和行动是相同的。,1.3.2博弈论的基本概念,房地产商博弈,A,开发,不开发,B

12、,B,开发,不开发,开发,(1，0),（0，1),(0,0),x,x,(-3,-3),不开发,1.3.2博弈论的基本概念,博弈方的得益：对应每个博弈方的每一组可能的决策选择，所应有的所得或所失。用ui表示第i个参与人的一个特定得益。用ui =(s1 ,si ,si )表示n个参与人的策略所对应的得益,1.3.2博弈论的基本概念,均衡：所有人参与人的最优策略的组合，记为,1.3.2博弈论的基本概念,信息：参与人在博弈中的知识，特别是有关 “自然”的选择其他参与人的特征和行动的知识。完美信息：每个参与人对其他参与人（包括虚拟参与人“自然”）的行动选择有准确的了解。完全信息：自然不首先行动或

13、自然的初始行动被所有参与人准确观察到的情况。共同知识：“所有参与人知道，所有参与人都知道所有参与人知道”,1.3.2博弈论的基本概念,分析：下述博弈的情况。例一：齐威王田忌赛马例二：黔馿之技,1.3.2博弈论的基本概念,例三：市场进入阻扰博弈,阻止,进入者,进入,不进入,默许,阻止,在位者,进入者,开发,不开发,默许,在位者,低成本的情况,高成本的情况,1.4 博弈论的分类,1.4.1博弈方的数量 1.4.2博弈中的策略 1.4.3博弈中的得益 1.4.4博弈的过程 1.4.5博弈的信息结构,1.4.1 博弈方的数量,“单人博弈”：只有一个博弈方的博弈。 “双人博弈”：两个各自独立决策，

14、但策略和利益具有相互依存的博弈方的决策。 “多人博弈”：有三个或三个以上博弈方参加，各自独立决策，但策略和利益具有相互依存的博弈,一、单人博弈只有一个博弈方的博弈,例一：单人迷宫,一、单人博弈只有一个博弈方的博弈,例二：运输路线,单人博弈实质个体最优化问题,二、两人博弈两个博弈方的博弈,例一：猜硬币博弈,二、两人博弈两个博弈方的博弈,例二：房地产开发博弈,A,开发,不开发,B,B,开发,不开发,开发,(1，0),（0，1),(0,0),x,x,不开发,(-3,-3),二、三人博弈三个或三个以上博弈方的博弈,三厂商竞争优势博弈,（厂商3新技术）,（厂商3老技术）,1.4.2博弈中的策略,有限博

15、弈(finite games)：如果一个博弈中的每个博弈方的策略数都是有限的；猜硬币，田忌赛马，房地产商开发博弈无限博弈（infinite games）:如果一个博弈中至少有某些博弈方的策略是无限多个；古诺寡头竞争模型，库诺特寡头竞争模型,1.4.2博弈中的策略,例一古诺寡头竞争模型设一市场有1，2厂商生产同样的产品。如果厂商1的产量为q1 ，厂商2的产量为q2,则市场总产量为Q q1 q2 。设市场出清价格P是市场总产量的函数PP（Q）8Q。再设两厂商的生产成本为0.当他们在决策之前都不知道另一方的产量时，如何决定各自的产量？,1.4.3博弈论的得益,零和博弈：也称“严格竞争博弈”。

16、博弈方之间利益始终对立，偏好通常不同猜硬币，田忌赛马，石头-剪刀-布常和博弈：博弈方之间利益的总和为常数。博弈方之间的利益是对立的且是竞争关系分配固定数额的奖金、利润，遗产官司变和博弈：零和博弈和常和博弈以外的所有博弈。合作利益存在，博弈效率问题的重要性。囚徒困境、产量博弈、制式问题等,一、零和博弈博弈双方总和为零,例一：猜硬币博弈,一、零和博弈博弈双方得益总和为零,例二：田忌赛马,二、常和博弈博弈双方得益总和为常数,候选人博弈,5， 5,2， 8,8， 2,5， 5,不拉选票,拉选票,不拉选票,拉选票,两个罪犯的得益矩阵,候选人 2,候选人 1,三、常和博弈博弈双方得益总和不为常数

17、,例一：双寡头削价竞争,三、常和博弈博弈双方得益总和不为常数,例二：囚徒困境,-5， -5,0， -8,-8， 0,-1， -1,坦白,不坦白,坦白,不坦白,两个罪犯的得益矩阵,囚徒 2,1.4.4 博弈的过程,静态博弈：参与人同时选择行动或非同时行动但后行动者并不知道前行动者采取了什么具体行动；动态博弈：参与人行动有先后顺序，且后行动者能够观察先行动者选择的行动。,一、静态博弈博弈方不知其他博弈方的决策,例一：石头剪子布,0， 0,1， -1,-1， 1,-1， 1,1， -1,0， 0,1， -1,-1， 1,0， 0,石头,剪子,布,博弈方2,石头,剪子,布,博弈方 1

18、,一、静态博弈博弈方不知其他博弈方的决策,例二：囚徒困境,-5， -5,0， -8,-8， 0,-1， -1,坦白,不坦白,坦白,不坦白,两个罪犯的得益矩阵,囚徒 2,二、动态博弈后行动者知道先行动者的决策,例一：先来后到博弈,二、动态博弈后行动者知道先行动者的决策,房地产开发博弈,A,开发,不开发,B,B,开发,不开发,开发,(1，0),（0，1),(0,0),x,x,(-3,-3),不开发,1.4.5博弈的信息结构,完美信息：每个参与人对其他参与人（包括虚拟参与人“自然”）的行动选择有准确的了解。完全信息：每一个博弈方对所有其他博弈方的（对手）的特征、战略空间及支付函数有准确的知识

19、，否则为不完全信息。,1.4.5博弈的信息结构,完全且不完美信息博弈,-5， -5,0， -8,-8， 0,-1， -1,坦白,不坦白,坦白,不坦白,两个罪犯的得益矩阵,囚徒 2,囚徒 1,1.4.5博弈的信息结构,不完全信息博弈,阻止,进入者,进入,不进入,默许,阻止,在位者,进入者,开发,不开发,默许,低成本的情况,高成本的情况,1.4 博弈论的分类,博弈的划分,第二章完全静态信息博弈,本章首先回顾完全静态信息博弈的定义，然后介绍完全静态信息博弈的战略式表达式及其构造，随后引入完全静态信息博弈解的基本概念纳什均衡，和求解纳什均衡的一些基本思路和方法，并举例说明。最后分析混合策略的概念和

20、混合策略纳什均衡。,第二章完全静态信息博弈,2.1 战略式表达式 2.2 纳什均衡基本分析方法 2.3经典例题 2.4混合策略和混合策略纳什均衡 2.5纳什均衡的选择和分析方法扩展,2.1 基本概念及战略式表达,2.1.1 基本概念 2.1.2战略式表达,2.1.1完全静态信息博弈的基本概念,完全信息静态博弈完全信息：每个参与人对所有其他参与人的特征（包括战略空间、支付函数等）完全了解静态：所有参与人同时选择行动且只选择一次。同时：只要每个参与人在选择自己的行动时不知道其他参与人的选择，就是同时行动博弈分析的目的是预测均衡结果,2.1.2完全静态信息博弈的战略式表达,战略式表达又称为标

21、准式表达（normal form representation）: 所有参与人同时选择各自的战略，所有人选择的战略一起决定每个参与人的支付。,2.1.2完全静态信息博弈的战略式表达,战略式表达：,2.1.2完全静态信息博弈的战略式表达,例一：设一市场有1，2厂商生产同样的产品。如果厂商1的产量为q1 ，厂商2的产量为q2,则市场总产量为Q q1 q2 。设市场出清价格P是市场总产量的函数PP（Q）8Q。再设两厂商的生产成本为0.当他们在决策之前都不知道另一方的产量时，如何决定各自的产量？,2.1.2完全静态信息博弈的战略式表达,寡头产量博弈中，企业是参与人，产量是战略空间，利润是支付；战略式表

22、述博弈为：,2.1.2完全静态信息博弈的战略式表达,有限博弈 1、参与人的个数是有限的； 2、每个参与人可选的战略是有限的。两个人有限博弈的战略表述可以用矩阵形式表述：,2.1.2完全静态信息博弈的战略式表达,例一：囚徒困境,-5， -5,0， -8,-8， 0,-1， -1,坦白,不坦白,坦白,不坦白,两个罪犯的得益矩阵,囚徒 2,囚徒 1,2.2.2完全静态信息博弈的战略式表达,三人有限博弈的战略表述可以用矩阵形式表述：,（厂商3新技术）,（厂商3老技术）,2.1.2完全静态信息博弈的战略式表达例题,例一：性别战一男一女谈恋爱，有些业余活动要安排，或者去看足球比赛，或者去看芭蕾演出

23、。男的偏好足球，女的则更喜欢芭蕾。如果两人都去看足球，则男的获得2个单位，女的获得1个单位。如果如果两人都去看芭蕾，则男的获得1个单位，女的获得2个单位.如果两人分开，则没有支付。,2.1.2完全静态信息博弈的战略式表达例题,例一：性别战,芭蕾,男,足球,芭蕾,足球,2.1.2完全静态信息博弈的战略式表达例题,例二：斗鸡博弈（chicken game）设想两个人举着火棍从独木桥的两端走向中央进行火拼，每个人都有两种策略：继续前进，或退下阵来。若两人都继续前进，则两败俱伤，分别丢失3个单位；若一方前进另一方退下来，前进者取得胜利，获得2个单位，退下来的丢了面子，丧失1个单位；若两人都退下来，两

24、人都丢面子，各丧失1个单位。,2.1.2完全静态信息博弈的战略式表达例题,例二斗鸡博弈,退,B,A,进,退,进,2.1.2完全静态信息博弈的战略式表达例题,例三：智猪博弈猪圈里圈两头猪，一头大猪，一头小猪。猪圈的一头有一个猪食槽，另一头安装一个按钮，控制着猪食的供应。按一下按钮会有10个单位的猪食进槽，但谁按钮谁就需要付2个单位的成本。若大猪先到，大猪吃到9个单位，小猪只能吃一个单位；若同时到，大猪吃7个单位，小猪吃3个单位；若小猪先到，大猪吃6个单位，小猪吃4个单位。,2.1.2完全静态信息博弈的战略式表达例题,例三：智猪博弈,等待,小猪,大猪,按,等待,按,2.1.2完全静态信息博弈的

25、战略式表达习题,如果给你两个师的兵力，由你来当“司令”，任务是攻克“敌人”三个师占据的一座城市，规定双方的兵力只能整师调动。通往城市的道路只有甲乙两条，当你发起攻击的时候，你的兵力超过敌人，你就获胜，你的兵力比敌人的守备兵力少或者相等，你就失败。写出该博弈的战略式表达。,2.1.2完全静态信息博弈的战略式表达习题,敌人：四种部署方案 A 三个师都驻守甲方； B 两个师驻守甲方，一个师驻守乙方 C 一个师驻守甲方，两个师驻守乙方 D 三个师都驻守乙方我军： a 集中全部兵力从甲方进攻 b 兵分两路，一个从甲方，一个从乙方，同时进攻 c 集中兵力从乙方进攻,2.1.2完全静态信息博弈的战略式表达

26、习题,A,B,C,D,a,b,c,敌军,2.1.2完全静态信息博弈的战略式表达习题,两个老朋友在一起喝酒，每个人有四个纯战略：杠子、老虎、鸡和虫子，输赢规则是：杠子降鸡，鸡吃虫子，虫子降杠子，两人同时出令。如果一个打败另一个，赢的效用为1，输的效用为-1，否则效用为0，写出这个博弈的支付矩阵，,2.2纳什均衡,2.2.1 上策均衡（占优战略均衡） 2.2.2 重复剔除的占优均衡 2.2.3 纳什均衡 2.2.3.1 划线法 2.2.3.2箭头法,2.2.1 上策均衡,上策：不管其它博弈方选择什么策略，一博弈方的某个策略给他带来的得益始终高于其它的策略，至少不低于其他策略的策略，又称占优策略。,

27、2.2.1 上策均衡,上策均衡：一个博弈的某个策略组合中的所有策略都是各个博弈方各自的上策，必然是该博弈比较稳定的结果，又称占优策略。记为上策均衡不是普遍存在的,2.2.1 上策均衡,例一：囚徒困境,-5， -5,0， -8,-8， 0,-1， -1,坦白,不坦白,坦白,不坦白,囚徒 2,（坦白，坦白）为上策均衡,2.2.1 上策均衡,房地产商开发博弈,不开发,开发商A,开发,不开发,开发,开发商B,需求大的情况,2.2.1 上策均衡,注意：如果所有人都有（严格）上策存在，那么上策均衡就是可以预测的唯一均衡。占优战略只要求每个参与人是理性的，而不要求每个参与人知道其他参与人是理性的（也

28、就是说，不要求理性是共同知识）。,2.2.1 上策均衡,练习：在下列战略式表达中，找出上策均衡。,等待,小猪,大猪,按,等待,按,2.2.2重复剔除的占优均衡,严格下策（劣战略）：不管其它博弈方的策略如何变化，给一个博弈方带来的收益总是比另一种策略给他带来的收益小的策略.即思路：首先找到某个参与人的劣战略（假定存在），把这个劣战略剔除掉，重新构造一个不包含已剔除战略的新的博弈，然后再剔除这个新的博弈中的某个参与人的劣战略，一直重复这个过程，直到只剩下唯一的战略组合为止。这个唯一剩下的战略组合就是这个博弈的均衡解，称为“重复剔除的占优均衡”。,2.2.2重复剔除的占优均衡,例一：,2.2.2

29、重复剔除的占优均衡,例二：智猪博弈,等待,小猪,大猪,按,等待,按,2.2.2重复剔除的占优均衡,重复剔除的占优均衡战略组合称为重复剔除的占优均衡，如果它是重复剔除劣战略后剩下的唯一战略组合。如果这种唯一战略组合是存在的，我们就说该博弈是重复剔除占优可解。注意：如果重复剔除后的战略组合不唯一，该博弈就不是重复剔除占优可解的。,2.2.2重复剔除的占优均衡,注意：与占优战略均衡中的占优战略和劣战略不同，这里的占优战略或劣战略可能只是相对于另一个特定战略而言。,2.2.2重复剔除的占优均衡,练习：在下列战略式表达中，找出重复剔除的占优均衡。,C2,R1,R2,C1,C3,R3,2.2.2重

30、复剔除的占优均衡,注意：重复剔除的占优均衡结果与劣战略的剔除顺序是否有关取决于剔除的是否是严格劣战略.如果剔除的是弱劣战略，均衡结果可能与剔除顺序有关。,2.2.2重复剔除的占优均衡,C2,R1,R2,C1,C3,R3,剔除顺序：R3、C3、C2、R2，战略组合（R1，C1）,剔除顺序：C2、R2、C1、R3，战略组合（R1，C3）,2.2.2重复剔除的占优均衡,重复剔除的占优均衡要求每个参与人是理性的，而且要求“理性”是参与人的共同知识。即：所有参与人知道所有参与是理性的，所有参与人知道所有参与人知道所有参与是理性的。尽管许多博弈中重复剔除的占优均衡是一个合理的预测，但并不总是如此，尤

31、其是大概支付某些极端值的时候。,2.2.2重复剔除的占优均衡,U是A的最优选择，但是，只要有1/1000的概率B选R，A就会选D 博弈的结果对行为的不确定性是很敏感的，即使是很小的不确定性。,参与人B,参与人A,U,D,L,R,2.2.3 纳什均衡,对于相当多的博弈，我们无法运用重复剔除劣战略的方法找出均衡解。为了找出这些博弈的均衡解，需要引入纳什均衡。,B,A,进,退,进,退,2.2.3 纳什均衡,策略空间：博弈方的第个策略：博弈方的得益：博弈：纳什均衡：在博弈中，如果由各个博弈方的各一个策略组成的某个策略组合中，任一博弈方的策略，都是对其余博弈方策略的组合的最佳对策

32、，也即对任意都成立，则称为的一个纳什均衡,2.2.3 纳什均衡,通俗地说，纳什均衡的含义就是：给定你的策略，我的策略是最好的策略；给定我的策略，你的策略也是你的最好的策略。即双方在给定的策略下不愿意调整自己的策略。,2.2.3.1 划线法,2.2.3.2箭头法,2.2.3 纳什均衡,寻找纳什均衡,C2,R1,R2,C1,C3,R3,参与人B,参与人A,2.2.3 纳什均衡,一群赌徒在赌钱，每个人将钱放在自己身边（每个人都知道自己的钱有多少），忽然吹来一阵风将所有的钱都混在一起，使他们无法分辨哪些钱是自己的，纳什均衡为他们解决这个问题。,2.2.3 纳什均衡,不同均衡概念的关系,占优均

33、衡 DSE,重复剔除占优均衡 IEDE,纯战略纳什均衡 PNE,2.2.3 纳什均衡习题,假定有一个长度为1的线性城市，消费者均匀地分布在0,1区间里，分布密度为1.假定有两个商店，分别位于城市的两端，商店1在x0，商店2在x1，出售物质性能相同的产品。每个商店提供单位产品的成本为C。消费者购买商品的旅行成本与离商店的距离成比例，单位距离的成本为t.住在x的消费者如果在商店1采购，旅行成本为tx,商店2采购，则花费t(1-x).考虑两店之间价格竞争的纳什均衡。,2.3 经典例题,2.3.1 囚徒困境 2.3.2智猪博弈 2.3.3斗鸡博弈,2.3.1 囚徒困境,-5， -5,0， -8,-8，

34、 0,-1， -1,坦白,不坦白,坦白,不坦白,两个罪犯的得益矩阵,囚徒 2,囚徒 1,2.3.1 囚徒困境,个人理性和集体理性的矛盾；个人的“最优策略”使整个“系统”处于不利的状态。,2.3.1 囚徒困境,例一：鹬蚌相争一只河蚌正张开壳晒太阳，不料，飞来了一只鸟，张嘴去啄他的肉，河蚌连忙合起两张壳，紧紧钳住鸟的嘴巴，鸟说：“今天不下雨，明天不下雨，就会有死蚌肉。”河蚌说：“今天不放你，明天不放你，就会有死鸟。”谁也不肯松口，有一个渔夫看见了，便过来把他们一起捉走了。,2.3.1 囚徒困境,例二：卡特尔联盟：假设欧佩克只存在两个国家，伊朗和伊拉克。两个国家只有两个产量可以选择，分别是

35、每天200万桶原油或400万桶原油。根据这两个国家不同的决策，输入到全球市场的总量将是400万桶、600万桶或者800万桶。与这组数字对应，价格分别是25美元、15美元或者10美元。在伊朗，石油提炼成本是每桶2美元，而在伊拉克则是每桶4美元。以百万美元/天显示他们的利润。,2.3.1 囚徒困境,例二：卡特尔联盟,46， 42,26， 44,52， 22,32， 24,2,4,2,4,两个国家的得益矩阵,伊拉克的产量,伊朗的产量,2.3.1 囚徒困境,同样的情形发生在： 1996中国彩电企业峰会 2000年汽车价格同盟 2003年空调价格同盟,2.3.1 囚徒困境,例二：贸易壁垒设置的博弈分析：

36、假设存在两个国家A、B。A国家在生产甲产品上具有优势，B国家在生产乙产品上具有优势。两个国家可以可以分别从对方国家进口自己的劣势产品，出口自己的优势产品。,2.3.1 囚徒困境,例三：贸易壁垒设置的博弈分析,0，0,1， 1,1，1,0.5， 0.5,设置壁垒,不设置壁垒,设置壁垒,不设置壁垒,两个国家的得益矩阵,国家B,国家A,2.3.1 囚徒困境,同样的情形发生在：公共产品的供给美苏军备竞赛,2.3.1 囚徒困境,解决囚徒困境问题的“出路” “解决个人理性和集体理性之间冲突的办法不是否认个人理性，而是设计一种机制，在满足个人理性的前提下达到集体理性”； “一种制度安排，要发生效力，必

37、须是一种纳什均衡，必须能改变双方的收益。否则，这种制度安排便不能成立”。囚徒困境的效果在不同情况下对社会而言可能是“负面”的，也可能是“正面”的。,2.3.1 囚徒困境,例一: 假设他们同属一个帮派组织，坦白者则要遭到组织的严厉惩罚，可能是死刑。不坦白者可以从组织中得到一定补偿。,2.3.1 囚徒困境,例二： 1971年，美国国会通过了禁止在电视上做烟草广告的法律。令许多人奇怪的是，财大气粗的各大烟草公司反应相当平静，并没有动用其庞大的社会资源和影响力阻止这个法律的通过。政府管制最终的结果是，尽管烟草广告因受到限制而减少，可是烟草公司的利润却提高了。实际上，政府禁令不仅没有打击烟草公司，反而

38、是把陷入白热化广告战的各大烟草集团从“囚徒困境”中解放了出来。,2.3.2 智猪博弈,等待,小猪,大猪,按,等待,按,纳什均衡：大猪按，小猪等待各得四个单位（4，4）多劳者不多得,2.3.2 智猪博弈,例一：公共产品博弈村里住两户人家，一户富，一户穷，有一条路年久失修。修路必须付出4个单位的成本。富人从修路中得到的效用比较大，7个单位，因为富户总是高朋满座，坐车坐轿的比较多，而穷户家只是自己穿着破鞋走路，路修好了，他走起来舒服，路修不好他也无所谓。因此，修路带给穷人1个单位。,2.3.2 智猪博弈,例二：在北约内部，美国承担了防务开支很大比例的份额，大大便宜了西欧和日本。,2.3.2

39、智猪博弈,例三：某大学公开招聘两名教授，一个教经济学，一个教会计学。经过层层选拔，最终A教授和B教授两人获得机会。会计学教授的工资是5000元/月，经济学教授的工资是3500元/月。A、B两教授具有相同的学历背景-会计学硕士。同时又都有经济学的教学经验，A授的会计学教学经验优于B教授。依一般人的想法，知识就是金钱，知识越多，工资越高，A教授理所当然的会获得会计学教授职位。因为B教授知道市场行情，而且知道到了目前，不可能有新的竞争者加入。因此，在与教务主任谈判时，极力否认自己具有经济学的教学经验，甚至说如果让他去讲授经济学会误人子弟，与其这样，自己宁可不要这分工作。而A教授为了证明自己的能力，

40、一开始就合盘托出，甚至大谈特谈自己的经济学教学经验。事情到此为止，我想每个人都看出了门道，学校不可能重新招聘，而两个教授也都不可能随便丢掉到手的美差。最终的结果就是B教授获得了会计学的教授职位，而A教授只好退而求其次，教授经济学。,2.3.2 智猪博弈,类似例子：股份公司中大股东小股东监督纳什均衡：大股东担当监督经理的责任，小股东搭便车市场中的大企业小企业研究开发、为新产品做广告纳什均衡：大户修路改革中得到好处多的少的改革股市的大户小户炒股纳什均衡：大户搜集信息，小户跟大户,2.3.2 智猪博弈,解决智猪博弈问题的“出路” 设计一种合理的激励机制，能够调动积极性；

41、 “一种制度安排，要发生效力，必须是一种纳什均衡，必须能改变双方的收益。否则，这种制度安排便不能成立”。,2.3.2 智猪博弈,首先来看看减量方案。食物为原来的一半，即5个单位的食物。结果，小猪大猪都不去按按钮。其次再来看看增量方案。食物是原来的两倍，即20个单位的食物。结果是小猪、大猪都会去抢着去按按钮。最后再来看看移位方案。其一，移位并减少食物投放量。食物只有原来的一半分量，其二，移位并增加食物投放量。其三，移位但不改变食物投放量。,2.3.3斗鸡博弈,退,B,A,进,退,进,2.3.3斗鸡博弈,例一:胆小鬼博弈两位驾驶员在十字路口相遇，双方都可以选择直驶或者转弯。如果双方都直

42、驶，则会酿成车祸。如果一方直驶一方转弯，直驶的一方被称为男子汉，转弯的一方被称为胆小鬼。双方都转弯，则都是胆小鬼。,2.3.3斗鸡博弈,例一：胆小鬼博弈,转弯,B,A,直驶,转弯,直驶,2.3.3斗鸡博弈,例二:美苏古巴导弹危机冷战期间美苏争霸最严重的一次危机。苏联：面临将导弹撤回国还是坚持部署在古巴的选择；美国：挑起战争还是容忍苏联的了挑衅行为。结果：苏联：将导弹从古巴撤回，做了丢面子的“撤退的鸡”，美国：坚持自己的的策略，做了“不退的鸡”，但是象征性地从土耳其撤回了一些导弹，给苏联一点面子。,2.3.3斗鸡博弈,类似例子冷战期间美苏抢占地盘：一方抢占一块地盘，另一方就占另一块

43、。村子里有两户富户，有两种可能：一家修，另一家就不修；一家不修，另一家就得修。 3. 警察与游行队伍。游行队伍与警察越来越近，定要有一方退下来。夫妻吵架，一方厉害，另一方就出去躲躲。,2.3.3斗鸡博弈,一艘军舰在夜航中，舰长发现前方航线上出现了灯光。舰长马上呼叫：“对面船只，右转30度。” 对方回答：“请对面船只左转30度。” “我是美国海军上校，右转30度。” “我是加拿大海军二等兵，请左转30度。” 舰长生气了：“听着，我是列克星顿号战列舰舰长，这是美国海军最强大的武装力量，右转30度！” “我是灯塔管理员，请左转30度。” 即使你官阶、舰船再大，灯塔也不会给你让路。那么，如果是两

44、条船相遇，又如何决定呢？,2.3.3斗鸡博弈,建议：最好避免遇上类似斗鸡博弈的事件。如果遇上，最明智的选择是及早脱身，以免造成骑虎难下的情况。,2.3.3斗鸡博弈,例一：拍卖拍卖规则是：轮流出价，谁出得最高，谁就将得到该物品，但是出价少的人不仅得不到该物品，并且要按他所叫的价付给拍卖方。,2.3.3斗鸡博弈,类似情况美国介入越南赌徒赌输了钱还要继续赌下去,2.4 混合策略,2.4.1混合策略纳什均衡 2.4.2混合策略和严格下策反复消去法,2.4.1混合纳什均衡,社会福利博弈,流浪汉,政府,救济,不救济,寻找工作,没有一个战略组合构成纳什均衡,2.4.1混合策略纳什均衡,石头剪子布,0

45、， 0,1， -1,-1， 1,-1， 1,1， -1,0， 0,1， -1,-1， 1,0， 0,石头,剪子,布,博弈方2,石头,剪子,布,博弈方 1,没有一个战略组合构成纳什均衡,2.4.1混合策略纳什均衡,上述博弈的特征是：在这类博弈中，都不存在纯纳什均衡。参与人的支付取决于其他参与人的战略；以某种概率分布随机地选择不同的行动每个参与人都想猜透对方的战略，而每个参与人又不愿意让对方猜透自己的战略,2.4.1混合策略纳什均衡,战略：参与人在给定信息集的情况下选择行动的规则，它规定参与人在什么情况下选择什么行动，是参与人的“相机行动方案”。纯战略：如果一个战略规定参与人在

46、每一个给定的信息情况下只选择一种特定的行动，该战略为纯战略。混合战略：如果一个战略规定参与人在给定信息情况下以某种概率分布随机地选择不同的行动，则该战略为混合战略。,2.4.1 混合策略纳什均衡,混合策略：如果一个策略规定参与人在给定信息情况下以某种概率分布随机地选择不同的行动，则该战略为混策战略。,2.4混合战略纳什均衡,纯战略可以理解为混合战略的特例，即在诸多战略中，选该纯战略si的概率为1，选其他纯战略的概率为0。,等待,小猪,大猪,按,等待,按,反面,正面,反面,正面,2.4.1混合纳什均衡,如何寻找混合战略纳什均衡？支付最大化法支付等值法由于混合策略伴随的是支付的

47、不确定性，因此参与人关心的是其期望效用。最优混合战略：是指使期望效用函数最大的混合战略（给定对方的混合策略）在两人博弈里，混合策略纳什均衡是两个参与人的最优混合策略的组合。,2.4.1混合纳什均衡,流浪,流浪汉,政府,救济,不救济,寻找工作,即：流浪汉以0.2的概率选择寻找工作，0.8的概率选择游荡,同样，可以根据流浪汉的期望效用函数找到政府的最优混合战略。？,支付最大化法,2.4.1混合战略纳什均衡,社会福利博弈,流浪,流浪汉,政府,救济,不救济,寻找工作,设：政府救济的概率：1/2 ；不救济的概率：1/2。流浪汉：寻找工作的概率：0. 2；流浪的概率：0.8 每个参与人的战略都是给定

48、对方混合战略时的最优战略,2.4.1混合纳什均衡,假定最优混合战略存在，给定流浪汉选择混合战略（r，1- r），政府选择纯战略救济的期望效用为： 3r+（-1）（1-r）=4r-1 选择纯战略不救济的效用为：-1r+0（1-r）=-r 如果一个混合战略（而不是纯战略）是政府的最优选择，一定意味着政府在救济与不救济之间是无差异的。 4r-1=-r r=0.2,流浪,流浪汉,政府,救济,不救济,寻找工作,支付等值法,2.4.1混合战略纳什均衡,社会福利博弈,流浪,流浪汉,政府,救济,不救济,寻找工作,设：政府救济的概率：1/2 ；不救济的概率：1/2。流浪汉：寻找工作的概率：0. 2；流浪的概率

49、：0.8 每个参与人的战略都是给定对方混合战略时的最优战略,2.4.1混合战略纳什均衡,假定最优混合战略存在，给定男选择混合战略（r，1- r），女选择纯战略足球的期望效用为： r+0（1-r）=r 选择纯战略芭蕾的效用为：0+2（1-r）=2-2r 如果一个混合战略（而不是纯战略）是女的最优选择，一定意味着政府在足球与芭蕾之间是无差异的。 22r=r r=2/3,芭蕾,男,足球,芭蕾,足球,女,2.4.1混合战略纳什均衡,假定男混合战略(,1- ），女选择混合战略（r，1- r），女期望效用函数为： v= r+2(1-)(1-r)=2-2-2r+3r 求微分可知，女的最优混合策略为（2/3,1/3）,芭蕾,男,足球,芭蕾,足球,女,2.4.2混

展开阅读全文