第6章扩展式博弈.ppt_三一文库31doc.com

资源描述

《第6章扩展式博弈.ppt》由会员分享，可在线阅读，更多相关《第6章扩展式博弈.ppt（65页珍藏版）》请在三一文库上搜索。

1、第二部分：完全信息动态博弈,第六章扩展式博弈,主要内容：一、扩展式博弈二、扩展式博弈的战略及其Nash均衡三、两种博弈描述形式的比较,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,主要内容：一、扩展式博弈二、扩展式博弈的战略及其Nash均衡三、两种博弈描述形式的比较,第六章扩展式博弈,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,一、扩展式博弈,所谓扩展式博弈(e

2、xtensive form game)是博弈问题的一种规范性描述。与战略式博弈侧重博弈结果的描述相比，扩展式博弈更注重对参与人在博弈过程中所遇到决策问题的序列结构的详细分析。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,研究博弈问题的具体进程必须弄清楚的两个问题,每个参与人在什么时候行动(决策)；每个参与人行动时，他所面临决策问题的结构。这包括参与人行动时可供他选择的行动方案，以及参与人行动时所了解的信息。,Control Science and Engineering, HUST

3、All Rights Reserved, 2007, Luo Yunfeng,上述两个问题构成了参与人在博弈过程中所遇到决策问题的序列结构。对于一个博弈问题，如果能够说清楚博弈过程中参与人的决策问题的序列结构，那么就意味着知道了博弈问题的具体进程。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,扩展式博弈的定义：,扩展式博弈包括以下要素：参与人集合；参与人的行动顺序，即每个参与人在何时行动；每个参与人行动时面临的决策问题，包括参与人行动时可供他选择的行动方案以及他所了解的信息；

4、参与人的支付函数，即博弈结束时每个参与人得到的博弈结果。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,如果要用扩展式博弈对一个博弈问题进行建模，那么除了要说明博弈问题所涉及到的参与人及每位参与人的支付函数以外，还必须对博弈过程中参与人所遇到的决策问题的序列结构，进行详细的解释，说清楚每个参与人在何时行动，以及参与人行动时可供选择的行动方案和所了解到的信息。,Control Science and Engineering, HUST All Rights Reserved, 2007,

5、 Luo Yunfeng,例子： “新产品开发博弈”,试用扩展式博弈对两个企业都知道市场需求，且企业1先决策，企业2观测到企业1的选择后再进行选择的博弈情形即完全信息动态的“新产品开发博弈”进行建模。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,完全信息动态的“新产品开发博弈”的扩展式博弈包括以下要素：,参与人是企业1和2；企业1先行动，企业2后行动；企业1行动时有两种选择“开发”和“不开发”，企业1行动时不知道企业2的行动；企业2行动时有两种选择“开发”和“不开发”，但企业2行动

6、时已经知道企业1的行动；,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,(4) 两个企业的支付如下：,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,在上述例子中，我们用文字描述的方法给出了博弈问题的扩展式描述。对于一些简单的博弈问题，这种文字表述的方法也许是简单可行的。但可以想象，如果我们遇到的是更为复杂的博弈问题，文字描述所给出的模型就会显得繁冗拖沓，极不直观。,Control

7、Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,因此，我们需要寻找一种简便易行的扩展式博弈的描述方式。下面我们就以“新产品开发博弈”为例，介绍一种不仅简单方便，而且十分直观的扩展式博弈的描述方式博弈树。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,所谓博弈树就是由结和有向枝构成的“有向树”。,Control Science and Engineering, HUST All Rights Rese

8、rved, 2007, Luo Yunfeng,最上端的一个点(用空心圆表示)，表示博弈的开始。,将“企业1”标示在点x1上，表示博弈开始于企业1的选择。,企业1的选择有“开发”和“不开发”，分别用标有“开发”和“不开发”的有向枝表示。,表示博弈达到该点时企业的所得，其中，支付向量中的第一个数字表示企业1的所得，第二个数字表示企业2的所得。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,Control Science and Engineering, HUST All Rights

9、 Reserved, 2007, Luo Yunfeng,回过来再考察上图中的博弈树，可以得到这样的信息：,博弈中的参与人是企业1和企业2；博弈中企业1先选择，企业2后选择；企业1选择时有行动“开发”和“不开发”，企业2选择的行动有“开发”和“不开发”；博弈中企业的支付。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,也就是说，除了“企业2行动时是否观测到企业1的选择”这一点，暂时无法从上图中知道以外，完全信息动态的“新产品开发博弈”的扩展式描述所需要的信息(或要素)，都可以从上图

10、中得到。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,如果还能够直接从博弈树中知道“企业2行动时是否观测到企业1的选择”，那么给出博弈树，就意味着给出了完全信息动态的“新产品开发博弈”的扩展式描述。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,问题：,如何在博弈树中，将“企业2行动时是否观测到企业1的选择”这一信息表示出来？,Control Science and Engine

11、ering, HUST All Rights Reserved, 2007, Luo Yunfeng,在完全信息动态的“新产品开发博弈”中，企业2决策时，企业1已经做出选择。此时，企业2面临的决策情形就有以下两种：企业2知道企业1的选择；企业2不知道企业1的选择。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,对于第一种情形，企业2知道企业1的选择，即知道企业1选择了“开发”还是“不开发”，因此，企业2知道博弈是从x1到了x2还是从x1到了x3。这就意味着当轮到企业2决策时，他知道自

12、己是在点x2上还是在点x3上；,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,对于第二种情形，企业2不知道企业1的选择，即不知道博弈是从x1到了x2还是从x1到了x3。因此，当轮到企业2决策时，他不知道自己是在点x2上还是在点x3上。所以，“企业2行动时是否观测到企业1的选择”这一问题，实际上就等价于“企业2行动时是否知道自己是在博弈树中的点x2上还是在点x3上”。,Control Science and Engineering, HUST All Rights Reserved, 20

13、07, Luo Yunfeng,为了将“企业2行动时是否知道自己是在博弈树中的点x2上还是在点x3上”这一点说清楚，需要引入“信息集”(information set)的概念。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,在博弈树中，参与人i的一个信息集(用Ii表示)是参与人i决策结的一个集合，它满足以下两个条件： Ii中的每个决策结都是参与人i的决策结；当博弈到达信息集Ii(即博弈到达Ii中某个决策结)时，参与人i知道自己是在信息集Ii中的决策结上，但不知道自己究竟在Ii中哪个决策

14、结上。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,因此，参与人i的信息集Ii可以用来描述：当轮到参与人i行动时，他所了解到的信息，即他知道什么(知道自己位于哪一个信息集上)、不知道什么(不知道自己位于信息集中哪一个决策结上)。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,例如,在“新产品开发博弈”中，假设企业1先行动，企业2后行动，但企业2行动时不知道企业1的行动。,企业2行

15、动时，只知道博弈要么到达点x2，要么达到点x3 ，但具体在哪一点上，企业2不清楚。也就是说，企业2只知道自己位于决策结集合x2, x3 上，但不知道位于x2, x3 中哪一个决策结上。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,设X为一决策结集合，用Ii(X)表示参与人的由决策结集X构成的一个信息集。例如，I2(x2, x3)表示企业2的由决策结集x2, x3构成的信息集，I2(x2)和I2(x3)分别表示企业2的由决策结集x2和x3构成的信息集。可以在博弈树中将同一信息集中的决

16、策结用虚线连接起来。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,下图表示参与人3选择时，知道参与人1的选择，但不知道参与人2的选择的博弈情形。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,下图表示参与人3选择时，知道参与人2的选择，但不知道参与人1的选择的博弈情形。,Control Science and Engineering, HUST All Rights Reserv

17、ed, 2007, Luo Yunfeng,下图表示参与人3选择时，即不知道参与人2的选择，也不知道参与人1的选择的博弈情形。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,下图表示参与人3选择时，即知道参与人2的选择，也知道参与人1的选择的博弈情形。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,在以后的讨论中，我们假设博弈树中的博弈都是从上往下进行的，因此，在不引起歧义的情况下

18、，我们都不标示出博弈树中枝的方向。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,例子：,考察“新产品开发博弈”。试用博弈树描述“两个企业都知道市场需求，且企业1先决策，企业2观测到企业1的选择后再进行选择”的博弈情形。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,当市场需求大时，“新产品开发博弈”的博弈树,Control Science and Engineering, HUS

19、T All Rights Reserved, 2007, Luo Yunfeng,当市场需求小时，“新产品开发博弈”的博弈树,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,由于在博弈分析中，假设博弈的结构(或描述方式)为共同知识，因此，在以后的讨论中，如果给出博弈树，就意味着所有的参与人都同时一起看到了博弈树。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,除了前面一再提到的博弈结

20、构和参与人完全理性为共同知识外，对于多阶段的动态博弈问题，一般还假设参与人满足“完美记忆”(perfect recall)要求，即假设参与人不会忘记以前知道或者做过的事情。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,但在现实生活中，不满足“完美记忆”要求的情形比比皆是。例如，人们在玩扑克时，往往会忘记自己曾经出过什么牌或者对手曾经出过什么牌；在棋类比赛中，也会出现这种情况。,Control Science and Engineering, HUST All Rights Reserv

21、ed, 2007, Luo Yunfeng,但是，在博弈分析中，如果没有“完美记忆”假设，各种博弈结果都有可能出现，那么我们也就无法对博弈进行预测。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,不满足“完美记忆”要求的博弈情形,参与人1第二次行动时忘了他第一次行动时的选择。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,主要内容：一、扩展式博弈二、扩展式博弈的战略及其Nas

22、h均衡三、两种博弈描述形式的比较,第六章扩展式博弈,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,二、扩展式博弈的战略及其Nash均衡,提出一个问题：给定一个博弈问题的扩展式，该如何来求解博弈问题的解？已知对于战略式博弈，可以用Nash均衡来描述博弈问题的解，对于博弈树所描述的扩展式博弈，是否同样可以用Nash均衡来描述博弈问题的解？,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfe

23、ng,对于一个博弈问题，要给出其战略式描述，就必须定义清楚该博弈问题的三个要素：参与人、参与人的战略以及参与人在相应战略组合下的支付。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,一个扩展式博弈实际上已定义了博弈的参与人及参与人的支付，因此，如果能定义一个扩展式博弈的战略，那么就意味着给出了一个扩展式博弈的战略式描述，同时也就意味着可以用Nash均衡来描述博弈的解。,Control Science and Engineering, HUST All Rights Reserved, 2

24、007, Luo Yunfeng,所谓参与人的战略就是参与人在博弈中的行动规则，它规定了参与人在博弈中每一种轮到自己行动的情形下，应该采取的行动。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,而在博弈树中，参与人在博弈中每一种轮到自己行动的情形又可以用一个信息集来表示，因此，参与人在扩展式博弈中的战略实际上就是参与人在每个信息集上的行动规则。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yun

25、feng,用 Hi 表示博弈树中参与人i的信息集的集合，即Hi=Ii；用Ai(Ii)表示参与人i在信息集Ii上的行动集， Ai(Hi)表示参与人在所有信息集上的行动集合，即,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,参与人i的一个纯战略si就是从信息集集合Hi到行动集合Ai(Hi)的一个映射关系，即其中，对,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,根据上述定义，参与人i

26、的一个纯战略可以解释为参与人i在各个信息集上的行动组合。因此，在以后的讨论中，可以用参与人i在每个信息集上的行动集Ai(Ii)的笛卡尔积来表示参与人i的战略集Si，即,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,例如：,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,参与人2的信息集为I2 (x2)，参与人2在I2 (x2)上的行动集为C,D。所以，参与人2的战略集为C,D ；

27、参与人1的信息集为I1 (x1)和I1 (x3) ，其中参与人1在I1 (x1)上的行动集为A,B，在I1 (x3)上的行动集为E,F。所以，参与人1的战略集为A,BE,F ，即A,E、A,F、B,E和B,F。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,给定一个博弈问题的扩展式描述，可以得到参与人的战略以及参与人在各战略组合下的支付，所以，由一个博弈问题的扩展式描述可以得到该博弈问题的战略式描述。,Control Science and Engineering, HUST All R

28、ights Reserved, 2007, Luo Yunfeng,例如,扩展式描述,战略式描述,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,由左图可得前面所示的扩展式博弈的Nash均衡(B,E),D)和(B,F),D)。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,主要内容：一、扩展式博弈二、扩展式博弈的战略及其Nash均衡三、两种博弈描述形式的比较,第六章扩展式博弈

29、,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,三、两种博弈描述形式的比较,战略式博弈从本质上来讲是一种静态模型。扩展式博弈从本质上来讲是一种动态模型。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,1.战略式博弈从本质上来讲是一种静态模型,战略式博弈从本质上来讲是一种静态模型，它假设所有的参与人同时选择战略并得到博弈的结果，至于博弈中参与人何时行动、行动时又如何行动等等，战略式

30、博弈并不考虑。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,这种建模方式对于描述完全信息的静态博弈问题，如“囚徒困境”、“性别战”等非常适用，也很直观。虽然战略式博弈也可用来对动态博弈问题进行建模，但从所得到的模型中，我们却无法直观地看到博弈问题所具有的动态特性。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,2.扩展式博弈从本质上来讲是一种动态模型,扩展式博弈从本质上来讲是一种

31、动态模型，它不仅直观地给出了博弈的结果，而且还对博弈的过程进行详尽的描述，如给出博弈中参与人的行动顺序，以及参与人行动时的决策环境和行动空间等等。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,前面我们已经看到，给出博弈问题的扩展式描述(如博弈树)，我们就可得到博弈问题的战略式描述。同样，在许多情况下，给出博弈问题的战略式描述，我们也能构造出博弈问题的扩展式描述。,Control Science and Engineering, HUST All Rights Reserved, 200

32、7, Luo Yunfeng,例如：,囚徒困境的战略式描述,囚徒困境的扩展式描述,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,但是，在求解博弈问题的解时，如果我们将Nash均衡当作博弈问题的解，那么我们可以直接根据战略式描述得到博弈的Nash均衡。而如果是扩展式博弈的话，则需要先给出博弈的战略式描述，才能得到博弈的Nash均衡。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,究其原因，主要在于Nash均衡本身只是一个静态的解的概念。,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,本章结束,

展开阅读全文