城市经济合作与发展的博弈.doc

资源描述

《城市经济合作与发展的博弈.doc》由会员分享，可在线阅读，更多相关《城市经济合作与发展的博弈.doc（49页珍藏版）》请在三一文库上搜索。

1、课程设计（论文）经济博弈论课程PBL教学模式问题研究报告题目：城市经济合作与发展的博弈学院经济与贸易学院专业经济学年级班别 2013级（1）班组别 2013级（1）班第二组组长梁毅军组员姓名：李顺强、黎泳希、李玉萍王金泉、区钰荧、杨春桃刘甜甜、陈珣、陈钰丰、陈建强指导教师朱怀念博士 2015 年6月摘要本研究报告运用完全和不完全信息静态博弈、完全和不完全信息动态博弈来研究城市经济的发展与合作的关系问题。本文通过建立囚徒困境模型、Stackelberg模型以及古诺模型等模型，分别分析了城市间在信息完全和信息不对称的情况下的战略选择问题。同时研究了如何走出囚徒困境

2、的方法，进而分析促进城市间合作的各种机制。本报告主要包括四个部分，第一部分是简要介绍本报告研究的基本内容和背景；第二部分是讲解了相关的博弈论相关理论和相关模型简介；第三部分主要是建立各个模型来分析城市间合作与竞争的战略选择问题；第四部分是讲述如何走出囚徒困境，促进城市间合作的问题。关键词：完全信息，不完全信息，城市产业，古诺模型，囚徒困境AbstractThis study reports the relationship between the development and the cooperation of the urban economy through the static ga

3、me, complete and incomplete information dynamic game. In this paper, to establish the model of prisoners dilemma model and Stackelberg model and Cournot model were analyzed between cities in the information completely and information asymmetry of the strategic choice. At the same time, it also studi

4、es how to get out of prisoners dilemma, and then analyze the mechanism of promoting the cooperation among cities. This report mainly includes four parts. The first part is brief introduction of main contents and background of the research reported in this; the second part is to explain the related g

5、ame theory related theory and model; the third part is mainly set up for each model to analyze inter city cooperation and competition strategy selection problem; the fourth part is about how to get out of the prisoners dilemma, and promote the cooperation between cities.Keyword: Complete information

6、, incomplete information, city of industry, Cournot model, prisoners dilemma目录第一章绪论51.1城市合作发展的背景与意义51.2问题的国内外研究现状61.3研究内容91.3.1基于完全信息静态博弈模型的城市产业发展分析91.3.2基于完全信息动态博弈模型的城市产业发展分析91.3.3基于不完全信息静态博弈模型的城市产业发展分析91.3.4基于不完全信息动态博弈模型的城市产业发展分析9第二章博弈论的相关理论92.1博弈论的基本概念92.2完全信息静态博弈的基本概念和基本模型112.3完全信息动态博弈的基本概念和基本模

7、型122.4不完全信息静态博弈的基本概念和基本模型152.5不完全信息动态博弈的基本概念和基本模型16第三章基于完全信息的城市合作与竞争博弈的分析183.1 基于完全信息静态博弈合作与竞争的分析193.1.1问题阐述193.1.2模型求解分析193.1.3结论203.2 基于完全信息动态博弈合作与竞争的分析203.2.1 问题阐述213.2.2 模型分析213.2.3 应用Stackelberg寡头竞争模型213.2.4结论：23第四章基于不完全信息的城市合作与竞争博弈的分析234.1 基于不完全信息静态博弈合作与竞争的分析244.1.1问题阐述244.1.2 模型求解分析244.1.3

8、结论264.2 基于不完全信息动态博弈合作与竞争的分析264.2.1 问题阐述274.2.2 模型求解分析274.2.3结论31第五章走出囚徒困境无限次重复性博弈325.1 无限次重复博弈335.1.1模型分析选择合作335.1.2合作与重复性博弈的关系335.1.3认识无限次重复性博弈345.2 无限重复古诺模型及其均衡分析355.2.1无限重复古诺模型355.2.2无限重复古诺模型的均衡分析355.2.3结论37第六章走出囚徒困境的其他方法386.1 政府干预途径386.1.1 问题描述396.1.2 模型分析396.1.3 结论396.2 外部性制度的改革406.2.1 现状阐述40

9、6.2.2 具体措施406.2.3 结论416.3 第三方城市进入426.3.1新增前提假设426.3.2博弈模型的建立426.3.3分析436.3.4结论446.4 建立战略联盟446.4.1问题阐述456.4.2假设及分析456.4.3结论45第七章结论45第一章绪论1.1城市合作发展的背景与意义第二次世界大战之后，区域经济一体化成为世界发展的潮流，发达国家也以城市群的发展作为国家经济实力发展的战略。随着我国区域经济一体化的加深，城市合作和同城化战略已经成为众多邻近城市间减少交易成本、提高核心竞争力与互利双赢的必然选择，而探索适适合我国国情和区域发展实际的城市合作模式已是当务之急。同时，

10、全球化和区域竞争引发了广泛的城市合作实践，城市合作是特定地域空间中城市共生演化的动态过程,城市合作的形成与发展,是多种行为主体在多种环境因素和历史因素作用下互动博弈的结果。1中国发展脚步越来越快，城市的规模越来越大，城市人口迅速膨胀。我国自改革开放以来，也初步形成了三大城市群的经济合作，分别是长江三角洲城市群、珠江三角洲城市群、京津唐城市群。目前，重点建设的有5大国家级城市群，包括长江三角洲城市群、珠江三角洲城市群、京津冀城市群、长江中游城市群和成渝城市群5大城市群。近年，随着我国自贸区的建设，长三角各主要城市将针对不同地区和经济发展的不同阶段，加强产业协同提升，搭建平台，促进区域内人、财、物

11、、信息等要素的合理流动。加强对区域内人口、土地、能效、投资等数据的分析和监测，建立专家库，为长三角新型城镇化建设提供决策依据。通过对长三角新型城镇化示范点的研究和建设，推动长三角产业和城镇的有效融合，促进城镇化和新农村建设的协调推进。而一带一路的正式提出，我国城市的经济区域一体化和城市群的发展进程，会随着基础设施的建设，特别是高铁等交通设施的建设，而不断地推进。西北和西南地区的交通条件的改善，城市经济区域一体化和城市群的进程将更加迅速。在这种发展进程中，虽然促进了经济的发展、改善人们生活环境，同时也带来了许多困难与问题，如污染、失业、住房困难、交通堵塞等等；另一方面，随着全球一体化的发展，城市

12、在国际关系中的地位也变得更加重要，城市间的交往与合作也变得更为密切，城市间的合作与发展也越来越重要。1.2问题的国内外研究现状城市经济合作与发展的研究，从总体来看，其观点经历了一个由均衡发展到不均衡发展，不均衡发展到不均衡协调发展的变化过程。区域经济理论渊源可以追溯到19世纪初开始创立的区位理论。德国经济学家杜能（Tunen,1886）从区域地租出发探索因地价不同而引起的农业分带现象，创立了农业区位论，从而奠定了区位经济学的学科基础。到了20世纪初，随着资本主义的发展和垄断现象的出现，德国的经济学家韦伯（Weber,1909）提出了工业区位论。20世纪30年代，德国地理学家克里斯塔斯（Chr

13、istaller,1933）通过研究村落和区位，提出了中心地理论。随后德国经济学家勒什（Losch,1940）利用克里斯塔斯的理论框架，把中心地理论发展成为产业的市场区位论，从而开始形成了较为完整的理论体系2。最初的区域经济发展阶段理论是由埃德加胡佛和约瑟夫费雪提出的区域标准阶段次序理论。胡佛和费雪指出,任何区域的经济发展都存在着“标准阶段次序”,这种标准阶段次序是指:区域自给自足经济发展阶段;区际贸易及手工业发展阶段;区域农产品专业化发展阶段;区域工业化发展阶段;区域第三产业发展阶段。美国经济学家罗斯托认为,一个区域的经济成长大体上要经历以下六个阶段:以传统农业为主的区域经济发展的初级阶段;

14、以经济上升所需各种条件正在形成为标志的区域经济起飞准备阶段;以重要工业部门产生为标志的区域经济起飞阶段;以现代技术波及到更大范围经济活动为标志的区域经济向成熟推进阶段;以经济资源越来越集中在生产耐用消费品为标志的区域高额大众消费阶段;以服务业发展为标志的区域追求生活质量阶段。受罗斯托经济增长阶段论的影响,美国经济学家约翰弗里德曼用实例论证了区域经济增长从不均衡到均衡的过程,提出了空间组织阶段理论。他认为,“区域经济的持续增长,推动着空间经济逐渐向一体化方向发展”3。上世纪四五十年代，著名发展经济学家Rosenstein Rodan (1943)以传统发展经济学的经济增长理论作为基础提出了大推进

15、理论4。大推进理论兼顾了关于经济增长生产函数、需求、储蓄供给三个“不可分割”的方面，但是忽略了经济学强调的资源稀缺性。后来美国经济学家North(1955)又提出了出口基地理论5，从外生需求的扩大是内生增长的主要原动力这一主要观点出发，论证了区域均衡发展的可行性。法国经济学家Perroux (1950)提出增长极理论，主张集中力量发展优势主导产业即增长极，通过外部经济和产业之间关联乘数效应推动其他产业的发展6。增长极理论只强调了增长极正面的影响，而忽视了其负面的影响。Myrdal(1957)所提出的“地理上的二元结构”理论则认为经济发展的不平衡由于“积累性的因果循环”会扩大区域的经济差距7。美

16、国经济学家Hirschman(1958)利用聚集经济的分析“核心边缘”理论，提出在区域发展不平衡的条件下，会形成区域发展的核心地区和边缘地区8。蒋清海(1994)指出，中国区域经济研究的热点问题主要有布局原则的研究结构的研究、宏观区域发展战略的研究、区域性地方发展战略的研究、区域产业区域经济管理体制的研究、区域市场发育的研究、区域经济协调发展的研究等9 .夏禹龙，冯之浚(1982)提出梯度发展战略。他们指出，我国由于历史、自然、社会等多方面的原因，区域经济技术发展不平衡，我国生产力的空间推移，应当承认这种客观存在的梯度，因势利导，让高梯度的东部地带掌握先进技术，然后逐步向梯度较低的中西部推移

17、。陆大道(1984)根据区位论和“空间结构理论”的基本原理，提出了点轴开发论（点轴开发理论，最早由波兰经济学家萨伦巴和马利士提出。中国的点轴开发模式最初由中科院地理所陆大道提出并系统阐述）。所谓点轴开发，是在全国或地区范围内，确定若干等级的具有有利发展条件的线状基础设施轴线，对轴线地带的若干个点中心城市给予重点发展。中国应重点开发沿海轴线和长江沿岸轴线，以此形成“T”字形战略布局。我国关于城市圈的研究，高汝熹明确了“大都市经济圈”的定义，他认为“大都市经济圈是以经济比较发达的城市为中心，通过经济辐射，带动周围城市和农村，以形成统一的生产和流通经济网络”。晏学峰(1986)，徐炳文(1987)先

18、后提出“”字型发展战略。该理论主张是，国家的开发重点除了“一”“ L”(沿海和长江流域)以外，还应把陇海兰新作为另一条“”字型开发轴线。顾朝林(1987)结合我国实际提出了城镇体系规划理论-三个结构一个网络（地域空间结构、等级规模结构、职能类型结构和城镇网络系统）为城市规划、区域经济规划部门广泛应用。魏后凯(1995)提出了网络开发理论。他认为区域经济发展是一个动态的过程，在发展中呈现出增长极点开发、点轴开发和网络开发三个不同阶段。任何一个区域经济的发展，总是最先从一些点开始，然后沿着一定的轴线在空间上延伸。厉以宁(2000)针对现实中社会经济发展的不平衡状况，提出了中心辐射战略。刘春成(

19、2008)在借鉴计算机双核之间的联系和分工机制的基础上,提出了城市群双核之间的联系和分工机制,力求对城市群尤其是京津冀城市群提供一定的理论和实施策略指导。根据已有文献，可见目前学界对于城市产业合作竞争的文献大多数都是基于宏观视角对城市群产业结构，产业发展的研究，研究视角是对整个城市群而言。在目前的研究中，从城市群内单个城市的视角研究产业发展较少。1.3研究内容1.3.1基于完全信息静态博弈模型的城市产业发展分析通过两个城市经济竞合博弈模型分析，将结果与“囚徒困境”博弈对比，借以检验：在一次博弈中，城市双方的机会主义行为是否会使双方陷入“囚徒困境”。1.3.2基于完全信息动态博弈模型的城市产业发

20、展分析基于完全信息的绝对优势产业动态博弈分析，分析不同的博弈情况下各城市产业收益情况。1.3.3基于不完全信息静态博弈模型的城市产业发展分析通过假设参与人城市各拥有一个产业，产业在两城市发展水平相同。以库诺特模型研究两城市在不完全信息下的静态博弈，进而求解分析出两个城市的战略选择。1.3.4基于不完全信息动态博弈模型的城市产业发展分析在一维动态博弈的基础上，假定有两个城市，其中一个城市是市场在位垄断者，另外一个城市为进入者，运用了市场阻扰进入的博弈模型，求解分析出两个城市的最优战略。1.3.5对于走出囚徒困境的方法与分析通过查询资料和结合书本知识，分析如何走出囚徒困境，进而代入到本课题的研究

21、，分析如何让城市间打破竞争的局面，促进双方合作，达到共赢。第二章博弈论的相关理论2.1博弈论的基本概念博弈论也称对策论，主要研究当多个决策主体之间存在利益关联甚至冲突时，各决策主体如何根据自身能力及所掌握的信息，做出有利于自己或者决策者的一种理论。博弈论的基本概念包括博弈参与人、行动、信息、战略、支付(效用)、结果和均衡。其中参与人、战略、支付构成博弈的三个基本要素，也是博弈不可缺少的主要要素。(1)参与人(player)，又称局中人或博弈方，是指博弈中的决策主体，根据自己的利益要求决定自己的行为。参与人可以是自然人，也可以是各种社会组织，如企业、家庭、社团及政府。一般用表示。为了分析方便

22、，在博弈论中“自然”作为“虚拟参与人”来处理。这里，“自然”是指决定外生的随机变量的概率分布的机制。(2)行动(actions or moves)，是参与人在博弈时的决策变量。一般用表示第个参与人的一个决策，表示第个参与人的决策集合。(3)信息(information)，是参与人关于博弈的知识，如博弈规则以及其他参与人的特征、行动和选择的知识。信息集包含参与人有关其他参与人之前行动的知识。(4)战略(strategy)，是参与人在博弈中选择行动的规则，它说明参与人在什么时候选择什么行动，称为“相机行动方案”。一般用表示第参与人的一个战略，表示第参与人所有可选择的战略集合。(5)支付(payof

23、f)，是参与人从博弈中获得的效用水平，或者是期望效用水平，所以是参与者最关心的事情。参与人的支付不仅取决于自己的战略选择，而且取决于所有其他参与人的战略选择，一般用表示第参与人的效用。由于博弈参与者决策的相互影响，它是所有参与人战略选择的函数，即。(6)结果(outcome)，是博弈分析者所感兴趣的所有东西，如均衡战略组合、均衡行动组合、均衡支付组合等。(7)均衡(equilibrium)，是所有参与人的最优战略或行动组合，一般记为，其中表示第参与人在均衡情况下的最优战略，它是的所有可能的战略中使效用或期望效用最大化的战略。在博弈论里，有各种各样的均衡概念，这里给出的是所有均衡概念的共同特征。

24、根据参与人在博弈中的行为是否达成一个具有约束力的协议，博弈论可划分为合作博弈与非合作博弈。如果有达成一个具有约束力的协议，就是合作博弈；反之，则是非合作博弈。根据博弈的时间或者参与人的行动顺序，可将博弈分为静态博弈和动态博弈；根据参与人所拥有的有关博弈的信息知识，可将博弈划分为完全信息博弈和不完全信息博弈；根据博弈的收益分配情况，可以将博弈划分为零和博弈与非零和博弈。2.2完全信息静态博弈的基本概念和基本模型1、完全信息指自然不首先行动或自然地初始行动被所有参与人准确观察到的情况，即事前没有不确定性。2、静态指所有参与人同时选择行动且只能选择一次。3、完全信息静态完全信息静态博弈理论是整个非

25、合作博弈理论的基础，它抽象出现实博弈形式中最基本的组成部分构成数学模型，由此对博弈人的理性行为形式规范描述，在此基础上进一步扩展为更复杂的博弈模型。完全信息静态博弈是一种最简单的博弈，在这种博弈中，由于每个人是在不知道其他参与人行动的情况下选择自己的行动，战略和实际行动是一回事儿。例子：囚徒困境博弈模型囚犯坦白抵赖 8，8 0 ，10 10 , 0 1，1 坦白囚犯A 抵赖 4、战略式战略式表述又称为标准式表述，在这种表述中，所有参与人同时选择各自的战略，所有参与人选择的战略一起决定每个参与人的支付。战略式表述必须明确表述清楚以下三点：（1)博弈参与人集合：ir r=1,2,3n（2)每个

26、参与人的战略空间：Si i=1,2,3n（3）每个参与人的支付函数：ui(s1,s2,s3sn) i=1,2,3n一般用：G=(S1,Sn;U1,Un)表示战略式描述的博弈。5、纳什均衡占优战略一个参与人的最优战略并不依赖于其他参与人的战略选择，也就是说，不论其他参与人选择什么战略，他的最优战略都是唯一的，这样的最优战略被称为“占优战略”。重复剔除劣战略首先找出某个参与人的劣战略，把这个劣战略剔除掉，重新构建一个不包含已剔除战略的新的博弈；然后再剔除这个新博弈中的某个参与人的劣战略；继续这个过程，一直到只剩下一个唯一的战略组合为止。这个唯一剩下的战略组合就是这个博弈的均衡解。纳什均衡的正式定

27、义：在有n个参与人的战略式表述博弈G=S1，Sn；u1，un中，战略组合S1*,，Sn*是一个纳什均衡，如果对于每一个i，Si*是给定其他参与人的选择S1*,S*i-1,S*i+1,，Sn*的情况下第i个人的最优战略，即即ui（S1*,S*i-1,Si*,S*i+1,，Sn*）ui（S1*,S*i-1,Sij*,S*i+1,，Sn*）2.3完全信息动态博弈的基本概念和基本模型完全信息动态博弈基本概念所谓动态博弈就是参与人的行动有先后顺序，且后行动者在自己行动之前能观测到先行者的行动。在博弈论当中，通常用扩展式表述来描述和分析动态博弈。动态博弈的扩展式表述包括以下要素：参与人集合：i=1，2

28、，，n，此外，我们将用N代表虚拟参与人“自然”；参与人的行动顺序：谁在什么时候行动；参与人的行动空间：在每次行动时，参与人有什么选择；参与人的信息集：每次行动时，参与人知道些什么；参与人的支付函数；在行动结束之后，每个参与人得到些什么（支付是所有行动的函数）；外生事件（即自然选择）的概率分布博弈树与子博弈如同两人有限战略博弈的战略式表述可以用博弈矩阵来表示一样，n人有限战略博弈的扩展式表述可以用博弈树来表示。博弈树在博弈论中的应用很广泛，它几乎给出了博弈的所有信息。对于动态博弈，我们首先要了解“子博弈”的概念。子博弈就是在一个扩展式中，有一个决策结（是一个单结信息集）和所有该决策

29、结的后续结组成的部分。由定义易知，子博弈是原博弈的一部分，并且其本身可以作为一个独立的博弈进行分析。除此之外，还应清楚几个概念：结：包括决策结和终点结两类；决策结是参与人采取行动的时点，终点结是博弈行动路径的终点。枝：在博弈树上，枝是从一个决策结到它的直接后续结的连线（有时候用箭头表示），每一个枝代表参与人的一个行动选择。信息集：博弈树上的所有决策结分割成的信息集。每一个信息集是决策结集合的一个子集，该子集包括所有满足下列条件的决策结：每一个决策结都是同一参与人的决策结；该参与人知道博弈进入该集合的某个决策结，但不知道子集究竟处于哪一个决策结。假如一个扩展式博弈的博弈树如下形式：图2.1 博

30、弈树如图2.1，参与人1和参与人2的信息集是单结的，因此由参与人1与参与人2的任何一个决策结开始及后面的所有决策结均可构成子博弈，而参与人3的信息集不是单结的，因此，图中的参与人3左侧的一个决策结就不能构成子博弈。子博弈精炼纳什均衡(1)概念： “子博弈精炼纳什均衡”又称“子对策完美纳什均衡”。将纳什均衡中包含的不可置信的威胁策略剔除出去。它要求参与者的决策在任何时点上都是最优的，决策者要“随机应变”、“向前看”，而不是固守旧略。由于剔除了不可置信的威胁，在许多情况下，精炼纳什均衡也就缩小了纳什均衡的个数。这一点对预测分析是非常有意义的。只有当参与人的策略在每一个子博弈中都构成纳什均衡叫做精

31、炼纳什均衡。或者说，组成精炼纳什均衡的策略必须在每一个子博弈中都是最优的。(2)定义：子博弈：一个扩展式表示博弈的子博弈G是由一个单结信息集x开始的与所有该决策结的后续结(包括终点结)组成的能自成一个博弈的原博弈的一部分。对于扩展式博弈的策略组合S*=(S1*,Si*,Sn*) ,如果它是原博弈的纳什均衡;它在每一个子博弈上也都构成纳什均衡,则它是一个子博弈精炼纳什均衡。博弈论专家常常使用“序贯理性”(Sequential rationality)：指不论过去发生了什么，参与人应该在博弈的每个时点上最优化自己的策略。子博弈精炼纳什均衡所要求的正是参与人应该是序惯理性的。对于有限完全信息博

32、弈，逆向归纳法是求解子博弈精炼纳什均衡的最简便的方法。因为有限完美信息博弈的每一个决策结都开始一个子博弈。求解方法：最后一个结点上的子博弈（纳什均衡）倒数第二个（纳什均衡）初始结点上的子博弈（纳什均衡）。(3)如果：a) 它是原博弈的纳什均衡；b) 它在每一个子博弈上给出。则扩展式博弈的战略组合是一个精炼纳什均衡。 (4)求解方法：逆向归纳法（Backward Induction）是求解子博弈精炼纳什均衡的最简便方法。在求解子博弈精炼纳什均衡时，从最后一个子博弈开始逆推上去，这就是逆向归纳法。这是因为有限完美信息博弈的每一个决策结都是一个单独的信息集，每一个决策结都开始于一个子博弈。所以逆向

33、归纳法就是从动态博弈的最后一个阶段或最后一个子博弈开始，祝福向前倒推一求解动态博弈均衡的方法。2.4不完全信息静态博弈的基本概念和基本模型1、基本概念不完全信息静态博弈，是指至少某一个局中人不完全了解另一个局中人的特征，即不知道某一参与人的真实类型，但是知道每一种类型的出现的概率。海萨尼公理：假定概念分布密度P是所有局中人的共同知识。这一公理表明所有局中人有关自然行动的新年（belief）是相同的。贝叶斯纳什均衡（也简称贝叶斯均衡）是完全信息静态博弈纳什均衡概念在不完全信息静态博弈上的扩展。 2、贝叶斯纳什均衡定义：n人不完全信息静态博弈的纯战略贝叶斯纳什均衡G=A1,An; 1,n; P1,

34、Pn; 1,n; 的纯战略贝叶斯纳什均衡是一个类型依存战略组合，其中每个参与人i在给定自己的类型1和其他参与人类型依存战略的情况下最大化自己的期望效用函数Vi,换言之，战略组合是一个贝叶斯纳什均衡，如果对于所有的在上述定义中，A1,An表示战略空间，1,n表示参与人的类型空间，P1,Pn表示条件概率，1,n表示类型依存支付函数。和纳什均衡一样，贝叶斯纳什均衡在本质上也是一个一致性预测。贝叶斯均衡与纳什均衡的比较：与纯战略纳什均衡不同的是，在贝叶斯纳什均衡中参与人i知道具有j的参与人j将选择aj(j)但并不知道j。因此，即使纯战略选择也必须取支付函数的期望值。但如同纳什均衡一样，贝叶斯均衡在本

35、质上是一个一致性猜测，即每个参与人i都能正确预测到具有类型j的参与人j将选择aj*(j)，因此参与人i有关其他人的信念（条件概率）的信念并不进入均衡的定义，唯一重要的是参与人i自己的信念Pi和其他参与人的类型依存战略。 3、海萨尼转换在1967年以前，博弈论专家认为不完全信息博弈是无法分析的，因为当一个参与人并不知道他在与谁博弈时，博弈的规则是没有定义的。海萨尼在1967-1968年提出的转换方法“海萨尼转换”成为解决这一类博弈问题的标准方法。海萨尼在博弈中引入一个虚拟参与人“自然”，自然首先选择行动决定参与人的特征，参与人知道自己的特征，其他参与人不知道。这样，不完全信息博弈就转换为完全但不

36、完美信息博弈，这就是“海萨尼转换”。2.5不完全信息动态博弈的基本概念和基本模型1、基本概念在不完全信息动态博弈的情况下，每个参与人只知道自己的类型而不知道其他参与人的类型，就像是在博弈的开始阶段，存在一个参与人，名为“自然”，它先选择每个参与人的类型，然后参与人开始行动，参与人的行动有先有后，后行动者可以观察到先行动者的行动，但不能观察到先行动者所属类型。但是，因为参与人的行动是依据参与人所属类型而作出的，每个参与人的行动都传递着有关自己所属类型的信息，后行动者可以通过先行动者的行动来猜测先行动者的类型或者修正对先行动者所属类型的先验信念（表现为概率分布），然后根据修正后的后验信念选择自己的

37、最优行动。同样，先行动者会预测到自己的行动将被后行动者所利用，就会设法选择某些特定行动来迷惑后行动者，即选择那些传递对自己最有利的信息、避免传递对自己不利信息的行动。因此，博弈过程不仅仅是参与人选择行动的过程，而且是参与人不断修正自己信念的过程，比起完全信息动态博弈的情况要更加复杂。2、精炼贝叶斯模型假设博弈中有n个参与人，参与人i的所属类型是，i=1,2，n，是参与人i的私人信息，其他参与人并不知道且观察不到。记除了参与人p（）是参与人i认为除了自己外其他参与人所属类型的信念，即先验概率。设S是参与人i的战略空间，它包括参与人i所有的可能的战略；sS是i的一个特定战略，它依赖于参与人i的类型

38、。是在h个信息集上参与人i观测到的其他参与人的行动组合，它是战略组合（）的一部分，是除参与人i之外观测到的其他参与人的行动组合。条件概率是在观测到行动的情况下参与人i认为其他n-1参与人属于类型的后验概率，是上述的所有后验概率的集合，是属于类型的参与人i在选择战略s、其他参与人选择战略的情况下的效用函数。那么，精炼贝叶斯均衡可以定义如下：精炼贝叶斯均衡是一个战略组合()=()，()和一个后延概率组合=( ，)，满足：（P）对于所有的参与人i，在每一个信息集，有（B）是使用贝叶斯法则从先验概率、观测到的以及最优战略得到（在可能的情况下）。在上述定义中，（P）是精炼条件，它的意思是，给定其他参与

39、人的战略和参与人i的后验概率，每个参与人i的战略在所有从信息集h开始的后续博弈上都是最优的，或者说，所有参与人都是序贯理性的。第三章基于完全信息的城市合作与竞争博弈的分析3.1 基于完全信息静态博弈合作与竞争的分析3.1.1问题阐述假设中央政府计划在两个城市（城市1和城市2）发展某个创新产业，两个城市的基础设施，经济发展水平和人口密度等是一致的，但他们的共同目标都是为了本城市的经济更好地发展。假设两个城市只有两种方案可以选择：“合作和竞争”，并且两个城市各自独立做出自己的决策。如果两个城市共同合作发展该产业，那么他们各能获得A收益；如果一个城市选择合作，一个选择竞争，那么合作一方获得B收益，

40、竞争一方收益为C；如果两个城市都选择竞争，那么双方收益为D 。其战略式表达如下：博弈的参与人集合：ir r=城市，城市；每个参与人的战略空间Si i=合作，竞争，r；每个参与人的支付函数：(合作，合作)=A ，（合作，竞争）=B，（竞争，合作）=C，（竞争，竞争）=D，r，Si，ir3.1.2模型求解分析建立模型如图1所示：城市2 竞争合作城市1竞争合作D ,D C，，C ，图1. 城市合作与竞争静态博弈的战略式假设合作总收益大于竞争总收益，即CADB，那么，当城市2选择竞争时，对于城市1而言，他的最优选择为竞争（DB)；当城市2选择合作时，对于城市1而言，他的最优选择仍是竞

41、争(CA)。即，无论城市2作出什么选择，对于城市1而言，他的最优选择永远会是竞争，同理可得，对于城市2而言，他的最优选择也总是竞争，所以他们之间博弈的最优选择，即纳什均衡为（竞争，竞争），对应的支付组合为（D,D)。3.1.3结论总结而言，在两城市完全信息静态博弈，各自城市均已自身利益最大化为优先的理性思考为前提的条件下，两城市间的纳什均衡为（竞争，竞争）。但是在通过各个组合函数的对比，我们可以发现，其实他们之间的最优选择为（合作，合作）。从某种程度上来说，两城市间便陷入了“囚徒困境”之中，即：“理性”地选择了一个非最优战略，那么，要摆脱这个困境，我们就需要在这个博弈之间再增加一个无限重复博弈

42、战略以及相关的前提条件，从而使得他们能够“理性”地选择到支付组合中的最优组合（A,A）。3.2 基于完全信息动态博弈合作与竞争的分析3.2.1 问题阐述假设只存在两个城市（城市1和城市2），当地政府的目标为了提高本地区的经济发展速度、增加地方财政收入、完善投资环境，取得城市的最大利益，考虑是否与另一个城市进行合作。在完全信息动态博弈的条件下，两个城市之间在考虑是否合作时是有先后顺序的，并且后行动的城市知道先行动的城市的选择。假设两个城市（城市1和城市2），如果两个政府之间合作，各可以得到的收益8；如果一个合作，一个不合作，合作的一方得到1的收益，不合作的一方得到10的收益；如果两个政府相互竞争

43、，各得5的收益。基于完全信息的情况下，假设城市1先行动，城市2后行动，扩展式如下：竞争竞争合作合作竞争合作城市1城市2城市2 (8，8)）(1，10)（10，1）（5，5）城市合作与竞争动态博弈的扩展式3.2.2 模型分析用逆推归纳法，当城市2选择竞争时，城市1的最好选择是竞争。因为城市1选择竞争可以获得10个收益远远大于选择合作获得的1个收益。当城市2选择合作时，城市1的最好选择也是竞争。因为城市1选择竞争可以获得10个收益大于选择合作获得的8个收益。由于城市1先行动，因此他会选择竞争。 3.2.3 应用Stackelberg寡头竞争模型概念：Stackelberg是一种动态的寡头市场博弈模

44、型。该模型假设寡头市场上的两个厂商中，一方较强一方较弱。较强的一方(称为leader)领先行动，而较弱的一方(称为follower)则跟在较强的一方之后行动。由于该模型中两厂商的选择是有先后的，且后一厂商可以观察到前一厂商的选择，因此这是一个动态博弈。但是，因为两参与人的决策内容是产量水平，而可能的产量水平有无限多个，因此这是一个双方都有无限多种可能选择的无限战略博弈。Stackelberg模型与库诺特模型相比，唯一的不同是前者有一个选择的次序问题，其他如参与人、战略空间和收益函数等完全都是相同的。它根据逆向归纳法的思路，首先分析第二阶段厂商2的决策，剔除劣战略，最后求出的战略构成精炼纳什均衡

45、。模型求解：假定有两个城市，每个城市只有一家企业（企业1与企业2），他们的各个方面因素都相同，边际成本c1=c2=c，产品完全相同。他们的价格函数都为P=P(Q)=a-Q；总产量：（连续产量）Q= q1+q2;总成本分别为：c q1和c q2。收益函数为其利润：u1(q1, q2)=q1P(Q)c1q1=q1a(q1+q2)cq1=q1a(q1+q2)cu2(q1, q2)=q2P(Q)c2q2=q2a(q1+q2)cq2=q2a(q1+q2)c博弈过程如下，企业1选择的产量是q1，城市2是根据城市1的决策而决定自己的产量的。根据逆推归纳法的思路，我们首先要分析第二阶段企业2的决策，为此，我们先假设企业1的选择为q1是已经确定的。因此对于城市2而言，在给定企业1的产量是q1，为了使u2实现最大值的q2，它必须满足：a

展开阅读全文