第1章博弈论基本模型.ppt_三一文库31doc.com

资源描述

《第1章博弈论基本模型.ppt》由会员分享，可在线阅读，更多相关《第1章博弈论基本模型.ppt（39页珍藏版）》请在三一文库上搜索。

1、第1章博弈论基本模型（Game Theory）,华侨大学商学院,什么是学习？,学习的三个层次(大学之道，在明明德，在亲民，在止于至善) 专业学习：谋职、谋生（身无长物、何以生存）。事理学习：明白事理、懂得分析生活中的很多问题。（崔琦：明白这个世界是一个什么样子，这很重要）。一个人，其实只要懂得了加减乘除四则运算，就可以挣到钱买房买车，在物质世界中生活的很好。但这只是像一个盲人一样在生活，“春天来了，但我却看不到” 。（明明德）人生学习：充实人生、提高人生的境界、把学习融入人的生活中。人不是做事和挣钱的工具，而是宇宙中的有血有肉的生灵，需要提高生活的趣味，享受趣味化的人生，这就需要学习。

2、一个人，不会欣赏二泉映月，不会感受过禅宗的静谧，从来也不思考什么是天行健，好像也是在生活。看看很多人下班后在做什么？打牌、或者歌厅洗脚房等，当衣食住行解决了之后，就不知怎么过了，只有赌博和玩乐，却找不到真正的趣味。（身体在成长、心灵也在成长吗？）（新民）仰望星空,为什么学习？,从学习中获得心灵的提高，获得心灵的享受。学习，其实就为自己创造一个美丽的心灵世界的过程。有人说，我也没什么追求，就学一点实用知识就行，但问题是，你没有那些“无用”的知识，你怎么驾驭哪些实用的知识呢？“世人只知有用之用，而不知无用只用”。很多人30岁后就不再读书，到60岁还是30年前的思维；很多人感慨“现在一读书就

3、头痛”；农村现在不要为生存而挣扎了，那做什么呢？“我不打牌又做什么呢？” 每个人都生活在现实的物质世界和心灵的精神世界中，但很多人只知现实世界的繁华，却不知心灵世界的清新和高远。行万里路、读万卷书，就是为追求心灵世界。这些年我深刻体会到：生活的基础是衣食住行，但生活的重点在于文化和精神。我不知道文化有什么用，我只知道一个人没有了文化还有什么用呢？教师的功能：催化剂（使学生更快速更深入地学习）大医医心：能医心者，才是大医。,0 绪论,一、从三国演义谈起 1、曹操走华容道，有一条大路和一条小路，走哪条路呢？ 2、田忌与齐王赛马，孙膑出主意。 3、三个和尚没水喝，为什么？ 4、一个村子里，道路

4、泥泞，村子里一家很富有，其他贫穷，该修一条好路，能修成吗？ 5、剪刀-石头-布，为什么成为猜先的选择？ 6、黔驴是如何技穷的？ 7、A、B、C三人去钓鱼，A钓了5条，B钓了3条，C没钓着，中午一起吃饭，把钓的鱼吃完了，C不好意思，就给了A和B共8元钱，A和B如何分配？,二、什么是博弈论 1、安踏的广告是什么？ 2、一般人平时的思维是怎么样的？（决策，只知其一不知其二）（“我以为”，“我觉得”） 3、博弈论的思想是什么？（对策）博弈，就是对手之间的游戏（game)，在游戏中如何做到立于不败之地。博：？弈：？下棋的最高享受是什么？囚徒困境(Prisoners dilemma),博弈论的

5、创立与发展,1、博弈论思想最早产生于我国古代 2000多年前的春秋时期孙武在孙子兵法中论述的军事思想和治国策略，就蕴育了丰富和深刻的博弈论思想。田忌赛马：齐威王的上、中、下马分别优于大将田忌的上、中、下，但田忌上马、中马分别优于齐威王的中、下马。比赛规则：每次双方各出三匹马，一对一比赛三场，第一场的输方要赔一千金给赢方。,博弈论的创立与发展,2、博弈论的发展阶段第一阶段：萌芽期(20世纪40年代前)。利益冲突的研究是分散和初步的、带有很大程度的随意性。孙子兵法：古诺(Cournot,1883)古诺的“双寡头垄断”模型；艾奇沃思(F.Y.Edgeworth，1925)“双寡头等分市场”；霍

6、特林(H.Hotelling，1929)产品差异而引起的“价格竞争”模型；斯塔克尔伯格(H.V.Stackelberg，1934)“领导跟随(leaderfollower)”模型；斯威齐(P.M.Sweezy，1939)“折弯的需求曲线(Kinky Demand Curve)”模型等等。第二阶段：创立期(20世纪40年代)。博弈论首次系统地被引入经济学。 1944年冯诺依曼(Von.Neuman)和摩根斯坦恩(Morgen Stlern)合作出版了对策论与经济行为，从而奠定了合作博弈的理论与方法。,博弈论的创立与发展,第三阶段：大发展期(20世纪50s90s)。非合作博弈以及合作博弈的理论获

7、得了空前的发展。纳什(Nash，1950)n人非合作博弈及提出博弈均衡的定义塔克(A Tucker)提出“囚徒困境”(prisoners dilemma)模型泽尔腾(Selten，1965)提出精练子博弈纳什均衡概念，并把这一概念引入到了动态分析之中海萨尼(J.Harsnyi，19671986)提出贝叶斯纳什均衡概念，并把这一概念引入不完全信息博弈模型研究泽尔腾(Selten ，1975)，克瑞普斯(Kreps，1982)和威尔森(Wilson，1982)。弗得伯格(Fudenberg，1991)和泰勒尔(Tirole，1991)研究了精练贝叶斯纳什均衡，解决动态不完全信息博弈。泽

8、尔腾定义了“颤抖手均衡”(trembling hand equilibrium)；克瑞普斯和威尔森定义了“序贯均衡”(Sequential equilibrium)并提出了著名的“信誉”问题模型；弗得伯格和泰勒尔给出了“精练贝叶斯均衡”的正式定义。颤抖手均衡序贯均衡精练贝叶斯均衡(但在许多情况下，三个概念是一致的) 博弈论近期发展：除了博弈论与信息经济学的结合外，还出现了新的理论与应用分支诸如博弈学习理论、进化(演化)博弈论、博弈论与新制度经济学、博弈论与行为科学、博弈论与实验经济学、博弈论与组织管理的结合。,1.1 有限扩展型博弈模型,博弈模型的构建应用博弈论方法分析研究问题，首先要构造

9、出博弈模型来，因而需要从大量的博弈活动中抽象出博弈模型的基本要素，对这些要素进行严格、准确的刻画后，形成博弈模型。将博弈活动构造成博弈模型，需要了解以下6个方面的情况： 1.局中人； 2.外生事件的概率分布； 3.局中人选择行动的次序； 4.局中人所能选择的行动； 5. 局中人在选择行动时所了解的信息。 6.局中人的支付。,构造博弈模型所需要的要素 1.局中人集合，称为局中人或参与人集合。中元素称为参与人或局中人。参与人不专指人，它泛指参与博弈活动的政府、企业、地区、国家、个人等决策主体。通常用“0”表示虚拟局中人，它的行为是以确定的概率分布进行随机选择，表示实际参与人。 2.行动集

10、合称参与人在博弈中所有可能选择的行动构成的集合为局中人i的行动集合。中的元素称为局中人i 的行动。局中人的行动集合可能是有限集，也可能是无限集。如果博弈活动中每个局中人的行动集合都是有限集，且每个局中人行动的次数也是有限的，称该博弈为有限博弈。 3.博弈树对于有限博弈，可用博弈树直观地刻画它，市场进入问题的博弈树如图1-1所示(见p2上的例子)。,4. 支付向量博弈树中终点Z下面的向量称为支付向量，它的第个分量表示博弈结束于Z时,局中人i所得的支付。支付可表示参与人的某种收益或损失。本书中的支付指收益、效用、利润等。正式地，支付向量是终点集合Z到n维向量集合的映射。,5.

11、信息集与信息集分割信息集由同一个局中人、在相同的时点上的具有相同信息的决策节点组成。用表示局中人i的第k个信息集。它满足（1）（表示空集）；（2）从博弈起始点到任一终点的路径至多与交一点（描写同一信息集中的节点处于同一时点上）；（3）从中的任一节点出发，局中人i可能选择的行动集合都相同（因为局中人在同一信息集的不同节点上具有相同的信息）。在博弈树上，将属于同一信息集的节点用虚线框在一起。称为局中人的信息集类（在数学上，称以集合为元素的集合为类）。称为信息集分割。,有限扩展型博弈模型的定义定义1.1 称为有限扩展型博弈模型。其中N为参与人集合，Y为博弈树，U为

12、支付向量，I为信息集分割，q为外生事件的概率分布。完全信息博弈与不完全信息博弈如果所有的局中人对构成G的元素N,Y,U,I,q都完全了解，称G为完全信息博弈，否则为不完全信息博弈。静态博弈与动态博弈如果所有的局中人都同时选择行动，称G为静态博弈，否则，称G为动态博弈。静态博弈更本质的特征是所有局中人在选择行动时不知道对手选择了什么行动。,例1.1 考虑按以下步骤进行的博弈活动。第1步局中人1从字母T,H中选一个；第2步局中人2不知第1步的选择，再从H,T中选一字母；第3步局中人知道1，2两步的选择，又从T,H中选一字母；第4步局中人2不知第3步的选择，但知1，2两步的选

13、择，最后从T,H中选一字母，博弈结束。按照每步选择的结果，每个局中人各得一笔报酬（略）。该博弈的局中人集合 . 该博弈的信息集合分别为，其中。,信息集可以告诉我们以下4点 1.在一个信息集上应由哪个参与人选择行动。 2.从一个信息集出发，局中人可能选择哪些行动。 3.局中人在一个信息集上选择行动时已知道了哪些信息。 4.单点信息集表明相应的局中人完全了解博弈从开始到该信息集的博弈历程。完美信息博弈如果G的每个信息集都是单点信息集。表明博弈的每个参与人在选择行动时对博弈到现在为止的历程都完全了解，这时称G为完美信息博弈。扩展型博弈不仅能刻画动态博弈，也能刻画静态博弈,静态扩展型博弈的

14、例子,囚徒困境问题：p11 例1.6 完全信息:博弈各方对各个节点的支付都很明了. 完美信息:博弈各方对博弈进行的路径都很明了,完美信息这一概念只用于动态博弈。,例1.2 两个参与人同时从字母T,H中选择一个，博弈结束时两个参与人各得一笔支付，该博弈的博弈树如图1-3所示。练习：写出剪刀-石头-布的博弈树。,扩展型博弈的子博弈扩展型博弈的子博弈大体上说是原博弈的一部分，但它不能破坏原博弈的信息集。定义1.2 设为一有限扩展型博弈，从Y的决策节点h出发的子博弈满足（1）h是G的单点信息集；（2） N ；（3）是Y的子树，它由h及其后的所有节点与终点构成；（4）不能割裂G的信

15、息集；（5）若“自然”仍属于，则中“自然”的概率分布；（6）设Z为的终点，支付向量。,1.2 有限扩展型博弈的策略,策略的定义定义1.3 局中人的策略集合用表示，中的元素称为局中人 i 的策略。它定义为局中人i的信息集类到行动集的映射：策略是信息集的映射，行动是映射值。两者是不同的概念。相当于策略是函数，行动是函数值。,例1.3 考虑图1-1所示的扩展型博弈的策略。（p7）策略表明参与人2 在第1个信息集上选择行动，在第2个信息集上选择行动。其余策略可同样理解。 a11-进入；a12-不进入；a21-允许；,a22-抵制。 x1-表示2在I21上选择

16、的行动，可以是a21和a22; x2-是在I22上的选择。,例1.4 考虑例1.1所给出的扩展型博弈的策略。例1.5 考虑例1.2给出的扩展型博弈的策略。在静态博弈模型中，局中人策略与行动等同。,1.3 一般扩展型博弈模型,构成一般扩展型博弈模型的要素（1）一个有限的局中人集合：，其中“0”表示虚拟局中人“自然”，它以确定的概率分布进行随机选择。（2）一个满足下列三条性质的行动序列集合H。 H中包含一个空序列，即；如果局中人的有限行动序列 H，则对正整数 ,都有 H；对于局中人的无限行动序列，若对任何正整数都有，则 H,否则 H。称满足以上三条性质的行动序列集合H为

17、历史集。称历史集中的元素 H为博弈的一段历史。称一段历史 H为博弈的终点，如果它是无限的（）或不存在使 H。博弈全体终点构成集合记为 Z 。（3）局中人映射，表示历史h之后应由局中人i选择行动。（4）定义“自然”的行动集合上的概率分布为q。,（5）信息集分割。对于每个局中人，称集合（可为无穷）为的一个信息集分割，称为局中人的信息集，如果它满足性质；只要与同在内，则。表示局中人在历史之后的可能选择的行动集合。对，中至多有一段历史与h相交。（6）支付向量支付向量是终点到的映射。其中是当博弈结束于，局中人的支付值。,例1.1的一般扩

18、展型博弈模型 1.局中人集合 . 2.历史集合H= ，T，H，TT，TH，HT，HH，TTT，TTH，THT，THH，HTT，HTH，HHT，HHH，TTTT，TTTH，TTHT，TTHH，THTT，THTH，THH，THHH，HTTT，HTTH，HTHT，HTHH，HHTT，HHT，HHHT，HHHH 终点集合Z=TTTT，TTTH，TTHT，TTHH，THTT，THTH，THHT，THHH，HTTT，HTTH，HTHT，HTHH，HHTT，HHTH，HHHT，HHHH 3.局中人映射。 , , , 4.信息集分割。其中，，，， . 5.支付向量。一般扩展型博弈模型的策略和有限

19、扩展型模型一样，一般扩展型博弈模型的策略也是定义为信息集类到行动集的映射。，，（可为）。一般扩展型博弈模型的子博弈一般扩展型博弈模型的子博弈是从一个单点信息集引出，由局中人映射所确定的到终点集合的子博弈，子博弈不能割裂原博弈的信息集。,1.4 策略型博弈模型,1.4.1 策略型博弈模型的定义定义策略型博弈模型，仅需要局中人、策略、支付这三个要素。静态博弈的策略与行动是等同的。策略组合称由每个局中人的策略所构成的向量为一个策略组合，其中。称n个局中人的策略集的乘积集合为策略组合集合。支付函数局中人的支付函数是定义在策略组合集合S上，取值于实数的映射。。

20、局中人i 的支付函数是定义于策略组合集合上，而非 i的自身策略集上，表明局中人i的支付不仅与自己的策略有关，也与对手的策略组合有关，即博弈论中局中人之间的利益是互相制约的。这是博弈论与决策理论的一个重要区别。定义1.5 称为一个策略型博弈模型,例1.6 囚徒困境问题这个问题可以归结为下述静态信息完全的博弈模型 . 其中，局中人集合，1代表甲，2代表乙。两个局中人具有相同的策略集合：，其中C代表坦白，D代表抗拒的行动。对于策略组合， ,两个局中人的支付函数如下：该问题对应的扩展型博弈模型可用图1-4示的博弈树直观给出。,1.4.2 二人有限策略型博弈模型二人有限策略

21、型博弈模型设是一个策略型博弈模型，如果，，，即N是两个局中人的集合，都是有限集，称G为二人有限策略型博弈模型。,对于二人有限策略型博弈模型，定义，， . 称以下以向量为元素的矩阵为G的支付矩阵。二人有限策略型博弈模型可由支付矩阵完全描述,称为参与人1的支付矩阵，为参与人2的支付矩阵。二人有限策略型博弈G也可称为双矩阵博弈，记为囚徒困境问题是个二人有限策略型博弈，其支付矩阵为,1.4.3 重复剔除被严格占优策略均衡定义1.6 如果对于任何策略组合有，则称局中人i的策略严格占优策略，或被严格占优。在博弈论中，对于参与人的一个基本理性假设是：参与人偏好更

22、高的支付。因而不会使用被严格占优的策略。在上述理性假设下，我们有理由将被严格占优的策略删除。用剩余的策略组合预测博弈的结果。,重复剔除被严格占优策略均衡一个策略本来是不被严格占优的，但经过一轮删除被严格占优的策略后，它变为被严格占优的策略了，因而我们必须在第2轮中将其删除。在有限博弈中，这样的删除被严格占优策略的过程迟早会结束。如果结束时，仅剩下一个未被删除的策略组合，则称为重复剔除被严格占优策略均衡，称该博弈为严格占优可解的。我们可用重复剔除被严格占优策略均衡预测博弈的结果。在囚徒困境问题中，策略组合是重复剔除被严格占优策略均衡。,例1.7 伯川德价格竞争假设双寡头垄断市场中两个

23、企业都可选择价格策略高、中、低三种，支付矩阵为该博弈是严格占优可解的，策略组合（低，低）为重复剔除被严格占优策略均衡。并不是每个策略型博弈都是严格占优可解的。,例1.8 两个土地所有者共同拥有一防洪大堤，每个人分管一段进行维护，维护成本为4。如不维护，洪水造成的损失为10。该博弈的支付矩阵为该博弈不是严格占优可解的。对于不是严格占优可解的博弈，将继续讨论参与人应如何选取策略,1.5 扩展型博弈模型转化为策略型博弈模型,例1.9 考虑以下动态博弈。第1步，局中人1从1，2中选择一数；第2步，局中人2知道的值。从1，2中选；第3步，局中人1知道的值，从1，2中选，博弈结束。

24、对于给定的（）值，局中人2支付给局中人1一笔费用：，，，，，， u1(1,2,2)=-4, u1(2,2,2)=6,该博弈的局中人集合，为将其转化为策略型博弈，还需要确定出局中人的策略空间及支付函数或支付矩阵。局中人1的策略空间为局中人2的策略空间为该博弈对应的策略型博弈可由如下的支付矩阵给出。,该动态博弈所对应的博弈树如图1-6 所示。,该博弈对应的策略型博弈可由如下的支付矩阵给出。（p16）,例1.10 考虑如下动态博弈。第1步,局中人1从中选一数；第2步,局中人2知道，从中选；第3步,局中人1不知，也忘记了，从中选，博弈结束。对选定

25、的，局中人2支付给局中人1的费用与前例相同，该博弈对应的博弈树如图1-7 所示。,该博弈局中人集合为 . 局中人1的策略集合 . 局中人1的策略集合 . 支付矩阵为：从以上两例中，可以看到策略与行动这两个概念的明显的区别。,基本概念合作博弈非合作博弈有限扩展型博弈模型完全信息博弈不完全信息博弈静态博弈动态博弈完美信息博弈子博弈策略策略型博弈模型支付矩阵重复剔除被严格占优策略均衡严格占优可解博弈小结博弈论所研究的活动具有的特征，博弈论与决策理论区别。决策理论中一般仅有一个决策者，他们从个人效用最大化出发进行决策，而博弈论中有多个决策主体，这些主体之间是利益相

26、关的。博弈论主要讨论他们之间的策略互动关系。博弈论模型从形式可分为策略型博弈模型与扩展型博弈模型。扩展型模型完整地刻画了一项博弈活动。博弈树是扩展型模型的形象刻画，但它仅描述了有限的博弈模型。策略型博弈模型的结构简单，但它忽略了博弈的时序与信息，其侧重点在于分析参与人的策略选择。对于信息完全静态博弈,用策略型博弈刻画更为合适。对信息完全的动态博弈，用扩展型博弈模型描述更为合适。策略与行动是两个容易混淆的概念，其原因是在静态博中，策略与行动是等同的，而一般教材先介绍静态博弈，这可能会给自学者造成策略就是行动的先入为主的错误观念，这也是本书先介绍扩展型博弈后介绍策略型博弈的一个主要原因。本章还针对策略型博弈介绍了求解重复剔除被严格占优均衡的方法。本章重点要求掌握这个方法以及把已知扩展型博弈模型转化为策略型。重点要求能够区分策略与行动这两个概念。为了逻辑上的完整性，我们还在补充节中介绍了一般扩展型博弈。,参考书目,1、王则柯，博弈论平话。 2、谢识予，经济博弈论，复旦大学出版社。 3、罗杰.麦凯恩，博弈论战略分析入门，机械工业出版社。 4、张维迎，博弈论与信息经济学，上海三联出版社。,

展开阅读全文