首页 优秀范文 博弈论的方法

博弈论的方法赏析八篇

时间:2023-10-09 16:08:24

博弈论的方法

博弈论的方法第1篇

引言

一、两个简单的例子

1.1 老鹰(Hawk)与鸽子(Dove)博弈

1.2 系统选择博弈

二、进化博弈理论的产生及其发展

2.1 理性的由来及其缺陷

2.2 心理学研究成果及有限理性概念的提出

2.3 进化博弈理论的产生及其发展

三、进化博弈理论的基本内容

3.1 进化博弈理论基本模型分类

3.2 进化博弈理论基本均衡概念-----进化稳定策略

3.3 进化博弈理论基本动态概念----模仿者动态

四、进化博弈理论的应用

五、传统方法的缺陷及进化博弈理论研究方法的现实性

5.1 新古典经济学均衡分析法的缺陷

5.2 经典博弈理论的策略互动分析法及其缺陷

5.3 进化博弈理论局部动态分析方法的现实性

5.3.1 局部动态分析法的均衡观

5.3.2 局部动态法的时间观

5.3.3 局部动态法的均衡选择观

5.3.4 局部动态法的特殊性

六、结论

参考文献

摘要

本文从两个简单的博弈例子出发,以通俗的语言全面介绍了进化博弈理论的理性基础及其形成、发展、基本内容和部分应用,在此基础上文章进一步比较了新古典经济学、经典博弈理论 ①及进化博弈理论在研究方法上的不同之处,并特别强调了进化博弈理论局部动态法的均衡观、时间观、均衡选择观及方法上的特殊性。进化博弈理论的局部动态分析方法既是经济学研究方法的一次创新又是经济学直面现实的有力武器。

关键词:沉默互动;社会互动;进化稳定策略;模仿者动态;均衡分析法;局部动态法

引言

为什么同样一项经济制度在某个地方对经济发展有积极的推动作用而在另一个地方对经济发展却起着消极的阻碍作用?为什么能够有效降低交易费用的中介在一些地方会出现而在另一些地方却不能出现?为什么同样的管理方法在一个地方显示出高效率而在另一地方却不具有效率?诸如此类的问题,新古典经济学利用均衡分析法都无法给出令人满意的答案。均衡分析法的最大缺陷是把经济系统中参与人看作是互不联系的单个人(仅研究单个生产者或消费者的行为),不能把其所考察的问题放在一定的环境中去,该方法完全忽略了制度环境、社会环境及人文环境等对参与人行为的影响,单纯考察某个条件与结果之间的一一对应关系。因而,无法对现实中出现的诸多现象给予合理的解释。博弈理论尽管把参与人之间行为互动关系纳入到了模型之中,但依然没能跳出新古典均衡分析法的基本框架,并且由于其对理性赋予更强的假定,使得该理论更加脱离现实。进化博弈理论则一反常规,从一种全新的视角来考察经济及社会问题,它所提供的局部动态研究方法是从更现实的社会人出发,把其所考察的问题都置于一定的环境中进行更全面的分析,因而,其结论更接近于现实且具有较强的说服力。进化博弈理论属于经济学的前沿理论,该理论从其理论框架建立到现在仅仅只有近三十年的历史,但其在经济学、社会学、生态学等领域却得到了广泛的应用,近年来已经成为主流经济的研究方法之一。在我国由于历史原因,对经济学的研究起步较晚,特别对进化博弈这样的前沿理论更是知者甚少,本文的主要目的是以通俗的语言介绍进化博弈理论的相关内容及其应用,让读者对该理论有一个全面的了解。

本文的结构如下:第一部分给出进化博弈理论的两个典型的例子;第二部分对进化博弈理论的产生及其发展进行阐述;第三部分对进化博弈理论的基本内容进行简要的介绍;第四部分概述进化博弈理论的有关应用;第五部分论述传统的经济学研究方法的缺陷及进化博弈理论研究方法的现实性;第六部分对进化博弈理论的发展及理论前景进行简要的说明。

一、两个简单的例子

为了下文说明的方便,本文先给出进化博弈理论中两个具有代表性的例子,在此基础上再进一步给出该理论的基本内容及其研究方法的基本特点。

1.1 老鹰(Hawk)与鸽子(Dove)博弈

假定一个生态环境中有老鹰与鸽子两种动物,它们为了生存需要争夺有限的资源(如食物或生存空间等)而竞争。老鹰一般比较凶悍,必要时在斗争中直到重伤。鸽子一般比较温驯,竞争时在强敌面前常常退缩。竞争中获胜者得到了生存资源就可以更好地繁衍后代,重伤者则不利于其后代生长,即会减少其后代的数量。如果群体中老鹰与鸽子相遇并竞争资源,那么老鹰就会轻而易举地获得全部资源,而鸽子由于害怕强敌退出争夺,从而不能获得任何资源(当然不会受伤);如果群体中两个鸽子相遇并竞争生存资源,由于它们均胆小怕事不愿意战斗,结果平分资源;如果群体中两个老鹰相遇并竞争有限的生存资源,由于它们都非常勇猛而相互残杀,直到双方受到重伤而精疲力竭,结果虽然双方都获得部分生存资源但损失惨重,入不敷出。假定竞争中得到全部资源为50个单位(该数字也可以表示为生物的适应度、繁殖成活率或后代数量);得不到资源则表示其适应度为零;双方重伤则用来表示。于是老鹰、鸽子两种动物进行的资源竞争可以用一个对称博弈来描述,博弈的支付矩阵如下:

操作依赖于该群体的初始状态。如果初始时,该宿舍有多于4人使用操作系统,那么该宿舍所有学生最终都会使用该操作系统;否则所有学生最终会使用操作系统。

二、进化博弈理论的产生及其发展

进化博弈理论是经济学研究方法的一次创新,该理论从否定传统理论赖以成立的基础----理性人假定出发而建立起来一个新的分析框架,它结合了生态学、社会学、心理学及经济学的最新发展成果,从有限理性的社会人出发来分析参与人的资源配置行为。

2.1 理性的由来及其缺陷

经济学自从古希腊哲学中分离出来并成为一门系统的学问,是在亚当•斯密1776年发表《国富论》之后。以斯密为代表的古典经济学关注的核心是资源的稀缺程度如何能被人类经济活动所减少,他们关注的重点不是资源配置问题而是国民财富的增长及国别差异的原因。1890年马歇尔《经济学原理》的出版,标志着新古典经济学的成形,马歇尔之后,新古典经济学关注的核心逐渐转向在给定稀缺程度下资源的最优配置问题。稀缺资源的配置是需要人的参与,也就是说经济学研究的问题演变为关于经济中参与人如何把稀缺的资源配置到效率最高地方去的问题,强调个体行为在资源配置中的作用。经济中参与人的决策行为是通过高度复杂的思维活动作出的,为了更好地从微观个体行为来解释资源配置问题,新古典经济学借用了哲学中“理性”概念对复杂的人类行为过程进行了抽象的假定。然而,理性一词用于经济学时却对其含义的理解与哲学中对其含义的理解已经有了明显的区别。哲学中的理性是指人类所特有的用以探索自然和社会奥秘的认知能力,当代伟大的哲学家康德在其著作《纯理性批判》一书中指出,人类理性即认知能力并不是万能的,而是有限的。经济学中的理性则是指一种行为方式,具体地说即是经济中参与人对其所处世界的各种状态及不同状态对自己支付的意义都具有完全信息,并且在既定的条件下每个参与人都具有选择使自己获得最大效用或最大利润的能力。

经济学家认为理性是至高无上的,人们凭借理性就可以完全地认识自然与社会。经济学中对理性的含义经过这样的处理以后,就使得经济学能够充分运用数学理论发展的成果来进行分析。为了应用数学工具并更好地处理经济问题,传统经济学家们从偏好,信念及理性三个方面来界定经济主体的特征,其中信念就是个体认为不同结果将会出现的基于个体所获信息之上的条件概率。偏好则是基于不同结果的信念之上的序。理性是根据上述偏好及信念,个体获得最优决策的程度以及个体根据已经获得的信息来修正其信念的能力。这三个特征使得经济学研究的对象由现实人转向了理想化的对象,经济学越来越偏离了现实。

由理性概念而引致的缺陷首先表现在理性人具有无限的信息收集及处理能力的均衡观,认为经济系统常常处于均衡状态,非均衡只是一种暂时的现象,当受到外生因素扰动而使系统偏离均衡状态时,系统会以线性的方式回归均衡,这种机械式线性反应的均衡观来源于牛顿力学,由此而得出的比较静态分析法完全忽视了系统受到非线性扰动及连续因素的影响。其次表现在由全知全能的理性人而引致的均衡跳跃观,认为经济系统达到均衡或者从一个均衡到另一个均衡是不需要时间的,认为时间是可逆的,即经济变量与物理学的变量一样,只要条件相同系统的均衡也就相同,市场和经济对于过去的记忆是短暂的或者是没有的。这种应用经典牛顿力学分析方法来分析高度复杂的参与人经济行为使得其预测效果大打折扣。最后表现在其比较静态分析方法上,传统经济学的最基本分析方法----比较静态分析法赖以成立的基础是假定经济系统只受到外界一个个相互独立、互不重叠的冲击的影响,或者当一个因素的影响消除之后,下一因素才开始对经济系统产生影响。我们知道现实世界是普遍联系的,各种因素之间不可能相互独立,系统中任何一个因素的变动都会引起其他因素的变动,这些因素之间相互作用的时间可能很短也可能很长,各因素对最终目标会产生不同程度的影响。比较静态法却只见局部不见整体,企图通过比较不同均衡来找出系统达到均衡的条件,因此得不出符合现实的结论,其研究方法上的局限性大大降低了其理论的现实意义。

2.2 心理学研究成果及有限理性概念的提出

随着经济学家对理论研究的深入,特别近来实验经济学的迅速发展,主流经济学赖以成立的基础“理性人”假定及其基本的比较静态均衡分析法越来越受到了人们的质疑。相继出现了许多其他的研究方法,其中在经济学中影响最大的就是心理学的研究方法。心理学应用于经济分析有着非常曲折的历史。事实上,斯密、马歇尔、庇古、费雪尔和凯恩斯等一批古典经济学家都仔细地分析了偏好和信念的心理学基础。但从1940’s开始,一方面受到萨缪尔森及希克斯等新一派基于理性假定经济学家的影响,心理分析在经济学中的地位慢慢地被降低了;另一方面理性模型也遇到了许多如Allais(1952)悖论等难以给出合理解释的经济现象。于是1960’s开始,许多微观经济学家再次运用心理学研究方法来解释现实中的异常现象,宏观经济学也把经验法则和适应性预期纳入到其模型之中,正是在这一时期心理学家Simon(1957)提出了其著名的“有限理性”概念。然而,1970’s初随着Robert Lucas等人提出的理性预期理论、Selten、Kreps等倡导的强调正确信念及贝叶斯修正的博弈理论及Stiglitz、Spence等研究的信息经济学理论相继成为主流经济学的一部分,经济学界再一次掀起了排除渗透在经济学领域中心理学研究方法的热潮,心理的研究方法在经济学界几乎无立足之地,严格理性假定席卷整个经济学界。行为经济学的发起者Amos Tversky在经济学界根本找不到志趣相投者。1970’s末期,随着心理学家Amos Tversky与Kahneman合作发表了一系列应用心理分析方法来研究经济学问题的原创性文章,如1974年他们在Science发表的Judgment under uncertainty: Heuristics and biases,1979年他们合作在Econometrica发表Prospect theory: An analysis of decision under risk,慢慢消除了经济学界中存在的对心理学分析方法的偏见,此后应用心理分析方法来解释经济现象的文献见诸于各种经济学期刊之中,心理分析方法也渐渐地成为了主流经济学的研究方法之一。

进入1980’s,随着经典博弈理论、生态理论及心理学理论研究的深入发展,特别是心理学家西蒙把其在心理学领域研究的成果直接应用经济分析并因此获得了诺贝尔经济学奖,极大地激励着经济及社会学家从现实人行为出发来解释经济及社会现象。心理学研究表明人类认知过程首先表现为人们通过一种“感知秩序”进行学习活动,并形成分散的非同质的知识,其中“感知秩序”是指人的理解力、知识和人类行动之间的关系;其次表现为个体通过学习所达到的理性程度的有限性,组织学习个体学习行为的整合而形成的多层次“理性结构”,个体理性便会在一个累积性的组织或制度环境中得到塑造和提高并发挥作用,在这个过程中,个体学习行为总会受到组织、习惯和文化等制度性的限制和影响。西蒙认为人类并不是完全理性而是有限理性的,因为人类认知能力有着心理的临界极限,人类进行推理活动需要消耗大量的能量,推理也是一种相对稀缺的资源,另外决策者决策时需要大量的信息,而这些信息是不可能免费获得的,获得决策所需要的信息是需要大量成本的。考虑到参与人有限的知识水平、有限的推理能力、有限的信息收集及处理能力,经济主体的决策行为并非总是最大化的结果,其决策受到参与人所处的社会环境、过去的经验、日常惯例及其他人相似情形下的行为选择等因素的影响。在有限理性条件下,由于参与人无法免费获得决策所需要的全部信息,并且参与人即使获得了决策所需要的全部信息也可能由于有限的计算能力而无法得出最优决策。因此,参与人只能采取模仿、学习等简单的直观决策方法或一些固定的常规来进行决策。人类的决策结果受到复杂的认知过程的影响,不同的人或者同一个人在不同时间即使给出相同的条件也可能会得出不同的决策结果,即决策结果受到认知过程的路径影响。

2002年诺贝尔经济学奖得主之一心理学家丹尼尔·卡内曼(Daniel Kahneman)将源于心理学的综合洞察力应用于研究在不确定条件下参与人的决策过程及行为结果并展示了人为决策是如何异于标准经济理论预测的结果。在1979年,他与有着深厚数学及哲学背景的心理学家特韦尔斯基(Tversky)提出了震撼经济学界的“前景理论”(Prospect theory)。他们的发现激励了新一代经济学研究人员运用认知心理学来研究经济学,使经济学的理论更加丰富。一个理论获得诺贝尔经济学奖不仅是对获奖者过去成就的肯定,更主要说明了获奖理论将会成为主流经济学未来的发展方向。2002年诺贝尔经济学奖授予给丹尼尔·卡内曼标志着经济学的研究对象从传统的“经济人”转向现实的“社会人”,经济学直面现实。如何从有限理性出发来研究参与人的行为,许多经济学家对之进行了广泛而深入的研究并提出了许多理论,在这些理论之中影响最大且受到了经济学界普遍接受的理论即进化博弈理论。

2.3 进化博弈理论的产生及其发展

进化博弈理论源于对生态现象的解释,1960年代生态学家Lewontin就开始运用进化博弈理论的思想来研究生态问题。生态学家从动植物进化的研究中发现,动植物进化结果在多数情况下都可以用博弈论的纳什均衡概念来解释。然而,博弈论是研究完全理性的人类互动行为时提出来的,为什么能够解释根本无理性可言的动植物的进化现象呢?我们知道动植物的进化遵循达尔文“优胜劣汰”生物进化理论,生态演化的结果却能够利用博弈理论来给予合理的解释,这种巧合意味着我们可以去掉经典博弈理论中理性人假定的要求。另外,1960年代生态学理论研究取得突破性的进展,非合作博弈理论研究成果也不断涌现并日趋成熟,进化博弈理论具备了产生的现实及理论基础。

进化博弈理论应用于研究经济学问题在学术界曾经引起极大的争议,争论的焦点在于理性假定。当时由于理性概念在经济学界已经根深蒂固。多数人认为利用研究生态演化的进化博弈理论来研究参与人的行为是不合适的。因为动植物行为是完全由其基因所决定的,而经济问题则涉及到具有逻辑思维及学习、模仿能力的理性参与人的行为,因此,借助于进化博弈理论来研究远比动植物复杂的人类行为显然是行不通的。但随着心理学研究的发展及有限理性概念的提出,越来越多的经济学家应用进化博弈理论来解释经济现象并获得了巨大的成功,利用进化博弈理论来研究并解释经济现象的文献大量出现于各种经济学期刊了。尽管如此,利用进化博弈理论来解释经济现象还是需要对该理论的基本分析框架作出相应的调整。如果去掉参与人偏好、信念及理性假定等条件,那么参与人是如何作出决策的呢?进化博弈理论在处理有限理性参与人决策问题时,常常假定参与人遵循某种比贝叶斯法则更简单的行为规则,这种行为规则应该告诉如何采取行动及如何根据经验来改变行为选择,这样参与人只要知道什么会发生,而不必知道为什么会发生。

1970年代,生态学家Maynard Smith and Price(1973)结合生物进化论与经典博弈理论在研究生态演化现象的基础上而提出了进化博弈理论的基本均衡概念----进化稳定策略(Evolutionarily stable stragegy ESS),目前学术界普遍认为进化稳定策略概念的提出标志着进化博弈理论的诞生。此后,生态学家Taylor and Jonker(1978)在考察生态演化现象时首次提出了进化博弈理论的基本动态概念----模仿者动态(Replicator Dynamics)。至此,进化博弈理论有了明确的研究目标。

1980年代以后,随着新古典经济学及博弈论固有的缺陷逐渐被人们所认识,有限理性概念得到了学术界的普遍认可,加之进化博弈理论在解释生态现象时获得的巨大成功,特别是经济学界于1992年在康奈尔大学召开的进化博弈理论学术会议,正式确立了该理论的学术地位。一大批如Larry Sameulson、Ken Binmore、Peyton Young等经济学家从不同的角度对传统的进化博弈理论分析框架进行拓展,并使之逐渐转化为描述经济行为的理论。目前,进化博弈理论的基本理论体系虽然已经形成但还是相当粗糙。因此,它仍然处于不断发展和完善的阶段,但该理论提供了比传统理论更具现实性且能够更准确地解释并预测参与人行为的研究方法,从而得到了越来越多的经济学家、社会学家、生态学家的重视,我们有理由相信该理论成为主流经济学的一部分已经为时不远。

三、进化博弈理论的基本内容

进化博弈理论结合经典博弈理论及生态理论研究成果,并以有限理性的参与人群体为研究对象,利用动态分析方法把影响参与人行为的各种因素纳入其模型之中,并以系统论的观点来考察群体行为的演化趋势。

进化生态学与博弈论的结合至少已有三十几年的历史,初看起来使人觉得奇怪,因为博弈论常常假定参与人是完全理性的,而基因和其他的演化载体常常被假定是以一种完全机械的方式运动。然而一旦用参与人群体来代替博弈论中的参与者个人,用群体中选择不同纯策略的个体占群体中个体总数的百分比来代替博弈论中的混合策略,那么这两种理论就达到了形式上的统一。尽管这两种理论在形式上达到了统一,但进化博弈理论与经典博弈理论还是存在本质区别。在进化博弈理论中每个参与人都是随机地从群体中抽取并进行重复、匿名博弈,他们没有特定的博弈对手 ④。在这种情况下,参与人既可以通过自己的经验直接获得决策信息,也可以通过观察在相似环境中其他参与人的决策并模仿而间接地获得决策信息,还可以通过观察博弈的历史而从群体分布中获得决策信息。对参与人来说,观察群体行为的历史即估算群体分布是非常重要的,首先,群体分布包含了对手如何选择策略的信息。其次,通过观察群体分布也有助于参与人知道什么是好的策略什么是不好的策略。参与人常常会模仿好的策略⑤ 而不好的策略则会在进化过程中淘汰,模仿是学习过程中的一个重要组成部分,成功的行为不仅以说教的形式传递下来,而且也容易被模仿。参与人由于受到理性的约束而其行为是幼稚的(Naive),其决策不是通过迅速的最优化计算得到,而是需要经历一个适应性的调整过程,在此过程中参与人会受到其所处环境中各种确定性或随机性因素影响。因此,系统均衡是达到均衡过程的函数,要更准确地描述参与人行为就必须考察经济系统的动态调整过程,动态均衡概念及动态模型在进化博弈理论中占有相当重要的地位。

3.1 进化博弈理论基本模型分类

进化博弈理论的基本模型按其所考察的群体数目可分为单群体模型(Monomorphic Population Model)与多群体模型(Polymorphic Populations Model)。单群体模型直接来源生态学的研究,在研究生态现象时,生态学家常常把同一个生态环境中所有种群看作一个大群体,由于生物的行为是由其基因唯一确定的,因而可以把生态环境中每一个种群都程式化为一个特定的纯策略。经过这样处理以后,整个群体就相当于一个选择不同纯策略(纯策略集的数目就相当于群体中的种群数)的个体。群体中随机抽取的个体两两进行的都是对称博弈,有些文献中称这类模型为对称模型(Symmetry model)。严格地说,单群体时个体进行的并不是真正意义上的博弈,博弈是在个体与群体分布所代表的虚拟参与人之间进行。如第一部分的老鹰----鸽子博弈,该生态环境中有两个种群老鹰与鸽子,它们代表两个不同的纯策略,用进化方法进行处理时认为该生态群体中每个个体都有两种可供选择策略即老鹰策略与鸽子策略,此时的博弈并不是在随机抽取的两个个体之间进行,而是每个个体都观察群体状态(选择老鹰策略与鸽子策略个体数在群体中所占的比例),给定此状态它就可以计算自己选择不同策略所得的期望支付(严格地说这并不是期望支付,但为了说明的方便本文仍然借用该概念)进而确定选择哪一个策略不选择哪一个策略,对物种而言这就意味着种群数量的增加或减少。

多群体模型是由Selten (1980)首次提出并进行研究的,他在传统单群体生态进化模型中通过引入角色限制行为(Role Conditioned Behavior)而把对称模型变为了非对称模型。在非对称博弈个体之间有角色区分,此时可以从大群体中区分出不同的小群体,群体中随机抽取的个体之间进行真正意义上的两两配对重复、匿名非对称博弈,有时又称之为非对称模型(Asymmetry model)。如果我们把系统选择博弈中的宿舍变成学校(整个学校相当于一个大群体)而把十个人变成十个班(每一个班看成是一个小群体,且同一班的同学无角色区分即与单群体情形一样),每个班的学生都有多种选择,此时该校学生所进行的计算机系统选择博弈就是非对称博弈。非对称博弈模型并不是对单群体博弈模型的简单改进,由单群体到多群体涉及到一系列的如均衡及稳定性等问题的变化。Selten(1980)证明了“在多群体博弈中进化稳定均衡都是严格纳什均衡⑥ ”的结论,这就说明在多群体博弈中,传统的进化稳定均衡概念就显示出其局限性了。同时,在模仿者动态下,同一博弈在单群体与多群体时也会有不同的进化稳定均衡。

按照群体在演化过程中所受到的影响因素是确定性的还是随机性的,进化博弈模型可分为确定性动态模型和随机性动态模型。确定性模型一般比较简单并且能够较好地描述系统的演化趋势,因而,理论界对之进行较多的研究。随机性模型需要考虑许多随机因素对动态系统的影响,一般比较复杂,但该类模型却能够更准确地描述系统的行为,近年来理论界对之也进行广泛的探讨[对随机动态的详细讨论可以参阅这方面的经典文献Foster, D., and P. Young.(1990), Fudenberg, D. and C. Harris (1992), Kandori, M. G. Mailath, and R. Rob(1993)]。

3.2 进化博弈理论基本均衡概念-----进化稳定策略

进化博弈理论的基本均衡概念---进化稳定策略⑦ [文献2、5有详细介绍]是由Maynard Smith and Price(1973)及Maynard Smith(1974)在研究生态演化问题时提出来的,其直观思想是:如果一个群体(原群体)的行为模式能够消除任何小的突变群体,那么这种行为模式一定能够获得比突变群体高的支付,随着时间的演化突变者群体最后会从原群体中消失,原群体所选择的策略就是进化稳定策略。系统选择进化稳定策略时所处的状态即是进化稳定状态,此时的均衡就是进化稳定均衡。下面给出Maynard Smith and Price(1973)对进化稳定策略的定义(此后本文称之为原初定义),用符号表示如下:

说是进化稳定策略,如果,存在一个<,不等式对任意都成立。其中A是群体中个体博弈时的支付矩阵;y表示突变策略;是一个与突变策略y有关的常数,称之为侵入边界(Invasion Barriers);表示选择进化稳定策略群体与选择突变策略群体所组成的混合群体。实际上相当于该吸引子对应吸引域的半径,也就说进化稳定策略考察的是系统落于该均衡的吸引域范围之内的动态性质,而落于吸引域范围之外是不考虑的,所以说它只能够描述系统的局部动态性质。至于系统是如何进入吸引域的原初的进化稳定策略定义所没有给予足够的重视。

要准确地理解进化稳定策略概念就必须正确理解突变者和侵入边界的含义。我们可借助于前面的两个例子来理解。在老鹰、鸽子博弈中,当该生态环境中只有老鹰(或只有鸽子)时,这时系统已经处于均衡状态,但它们都是不稳定的均衡,因为这两个均衡都可以被突变者侵入。开始时,假定该生态环境处于老鹰均衡,如果由于某种原因而进入鸽子时,那么随着时间的演化,整个生态系统最终就会稳定于一半为老鹰一半为鸽子的状态,即混合策略纳什均衡是进化稳定的。这说明该博弈中两个纯策略纳什均衡是不稳定的。因为,当系统处于纯策略所表示的状态时,只要存在突变者系统就会离开这种状态,所以它们都不是进化稳定的。相反混合策略纳什均衡却不一样,即当系统处于一半是老鹰一半是鸽子时,如果由于某种因素使得系统偏离该状态,那么系统会自动恢复到原来状态。另外,在系统选择博弈中突变者、侵入边界就更为明显,所谓突变者即是指选择进化稳定策略以外的策略者,且侵入边界与不同的均衡有关。该博弈有两个纯策略纳什均衡和一个混合策略纳什均衡(),前一个均衡所对应的侵入边界就是,也就是说如果选择操作系统的学生数占群体总数的比例大于(即学生数大于4),那么选择操作系统的突变者就不可能侵入到该群体中,如果选择操作系统的学生数占群体总的比例小于(即学生数小于4),那么选择操作系统的突变者就会侵入到该群体中而原来选择操作系统的学生会转而学习操作系统。

最初进化稳定策略定义有比较苛刻的条件限制,如单群体、群体中个体数目无限大、系统只受到不连续且互不重叠冲击的影响等。这些条件大大地限制该定义的应用,随着学术界对进化博弈理论研究的深入,许多理论家们从不同的角度对最初定义进行了拓展,如Selten 1980首次给出了适应于描述多群体均衡的定义;Schaffer 1988首次给出了适应于描述有限规模群体的均衡定义;Foster and Young(1990)首次给出了适应于描述连续随机系统的均衡定义等等(有关对进化稳定策略进行拓展的讨论见文献[5])。最初定义是在解释生态现象时提出来的,如果进行经济分析,时需要进行相应的改变。在分析生态现象时,把每一个种群的行为都程式化为一个策略,因此进化的结果将会是突变种群的消失(消失的原因在于生物的行为是由其遗传基因唯一确定的)。如果用于经济分析,那么进化的结果将是那些选择突变策略的个体最终会改变策略而选择进化稳定策略(因为人类可以通过学习、模仿等来改变自己所选择的策略)。

经典博弈理论中的核心概念纳什均衡即是指一种策略组合,在该策略组合下任何个人单独偏离都不会变得比不偏离好。纳什均衡是一个静态概念,不能描述系统的动态性质,用数学语言来说它是动态系统的不动点,纳什的成功就是在于他应用拓扑学的不动点定理证明了纳什均衡的存在性。进化稳定策略必定是纳什均衡策略,它是纳什均衡的精练,文献[3]对此有详细的介绍。在进化稳定策略的定义中引入突变者及侵入边界使之能够更好地描述系统的局部动态性质。第一部分的两个例子中,按照纳什均衡的概念是无法得知两个系统最终会选择哪一个均衡,但利用进化稳定策略却可以说明系统最终会稳定哪一个均衡并可以分析系统达到不同均衡的条件,在某种程度上,较好地解决了多重均衡选择问题。

3.3 进化博弈理论基本动态概念----模仿者动态

进化博弈理论来源于生态学的研究,该理论基本上从“优胜劣汰”的进化论观点来看待群体行为的调整过程。一般的进化过程都包括两个可能的行为演化机制:选择机制(Selection Mechanism)和突变机制(Mutation mechanism)。选择机制是指本期中能够获得较高支付的策略,在下期被更多参与者选择;突变是指参与者以随机(无目的性)的方式选择策略,因此突变策略可能获得较高支付也可能获得较低支付,突变一般很少发生。新的突变也必须经过选择,并且只有获得较高支付的策略才能生存(Survive)下来。进化博弈理论需要解决的关键问题就是如何描述群体行为的这种选择机制和突变机制。博弈理论家对群体行为调整过程进行了广泛而深入的研究,由于他们考虑问题的角度不同,对群体行为调整过程的研究重点也就不同,因而提出了不同的动态模型,如Weibull(1995) 提出的模仿动态(Imitation Dynamics)模型,认为人们常常模仿其他人的行为尤其是能够产生较高支付的行为;Börgers and Sarin(1995,1997)等提出并应用强化动态(Reinforcement Dynamics)来研究现实中参与人的学习过程;Skyrms (1986) 引入了意向动态(Deliberational Dynamics)模型对哲学中的理性问题进行了讨论;Swinkels(1993)提出了近似调整动态(Myopic Adjustment Dynamics);Borgers and Sarin(1995)提出了刺激—反应动态(Stimulus-Response Dynamics)等等。到目前为止,在进化博弈理论中应用得最多的还是由Taylor and Jonker(1978)在对生态现象进行解释时首次提出描述单群体动态调整过程的模仿者动态(Replicator Dynamics)。所谓模仿者动态是指使用某一策略人数的增长率等于使用该策略时所得的支付与平均支付之差。下面就给出Taylor and Jonker(1978)提出的模仿者动态的微分形式:

化的而且因素之间的互动作用也是需要时间的。因此,均衡只是一种暂时现象或者在多数情况下,系统根本不可能达到的现象,要更准确地考察参与人的行为就必须运用系统论的观点,把行为互动性、因素互动性及时间因素纳入到其模型之中。

5.2 经典博弈理论的策略互动分析法及其缺陷

考虑到新古典经济学没有把参与人行为之间的互动关系纳入到其模型之中,经典博弈理论则在理性人假定的基础上把参与人行为的互动关系纳入到其模型之中进一步考察了参与人的决策问题。在我国,对人类互动行为的研究至少可以追溯到三国时期田赛马的故事,但作为一种正式理论提出来,一般认为是始于冯·诺意曼和摩根斯藤(Von Neumann and O. Morgenstern, 1944)出版的《博弈论与经济行为》一书,直到纳什(Nash 1950)在研究非合作博弈的基础上提出著名的纳什均衡(Nash Equilibrium)概念才使得博弈论成为一门完整的理论。经过近五十年的发展,终于在1994年,三位杰出的博弈论大师:纳什(John F. Nash)、泽尔藤(Rechard Selten)和海萨尼(John C. Harsanyi)获得了经济学的最高荣誉——诺贝尔经济学奖,在全球经济学界再次掀起了对博弈论的研究热潮。经典博弈论为社会科学提供了一个新的研究视角,使我们能够以全新的方法来处理各种冲突与合作的问题。博弈论作为一种理论工具,其应用相当广泛。在信息经济学中得到了充分的应用,1996年诺奖得主Mirrlees等、2001年诺奖得主Akerlof等都对信息经济学研究作出了卓越的贡献。这充分说明了博弈论在经济学的地位可见一斑。

经典博弈理论的核心概念----纳什均衡就是由普林斯顿大学数学家纳什在研究非合作博弈时提出来的。纳什均衡即是指给定其他参与人选择的情况下,每一个人单独偏离均衡都不会变得比不偏离好,显然纳什均衡是一个静态均衡概念。经典博弈理论尽管把参与人的互动行为引入到其模型之中,并认为现实中参与人不是孤立地作出自己的决策,每一个参与人的决策不仅依赖于其自身所面临的条件及其所拥有的信息,而且也依赖于其他参与人的决策选择。但该理论却面临着其自身无法克服的缺点。首先,博弈论中的互动是一种“沉默互动⑨ ”,这种互动不允许参与人之间存在任何形式的交流,即假定参与人都是一个个只会理性计算的孤立经济人而非社会人,一旦引入社会互动,许多博弈都无法进行分析,也就是说经典博弈理论中的互动并不“社会互动”而是孤立的“沉默互动”。其次,博弈论的基本均衡概念纳什均衡要求博弈各方都是理性的,并且理性是共同知识,博弈时如果某一方选择了非理,那么博弈就无法进行下去。特别地该理论在利用后向归纳法(Backward Induction)对纳什均衡进行精练时,不但要求参与人完全理性,而且还要求参与人的行为满足序贯理性(Sequential Rationality)要求。这一比理性更强的要求使得博弈论更加远离现实人。再次,在处理参与人所面临的不确定性时,不仅要求各参与人知道世界的各种状态,而且要求参与人知道每一种状态所出现的概率,并且给定一个先念信念,当出现任何新信息时,每个参与人都能够应用贝叶斯法则修正自己的先念信念,也就是说参与人不但具有很强的计算、推理能力,而且能够在一个大的状态空间上应用贝叶斯法则解决相当复杂的问题。现实中多数情况下,参与人并不都具有这种计算、推理能力。最后,博弈论碰到了其最棘手的问题就是多重均衡的处理,当博弈出现多重均衡特别是多重严格纳什均衡时,尽管许多理论家提出了一些方法(Selten(1965)提出的子博弈精炼纳什均衡概念,Selten(1975)提出的颤抖手精练纳什均衡,Kerps—wilson(1982)提出的序贯均衡,Schelling(1960)提出的聚点均衡等)来处理多重均衡问题,但始终没能获得一致认可的结论。

与新古典经济学相比,经典博弈理论虽然在其模型中纳入了行为的“沉默互动”关系,但该理论给出的研究方法仍然没能跳出新古典经济学的均衡分析框架,这种只注重结果而忽略达到结果的过程的分析方法依然把对经济系统的影响因素都看作为一个个孤立因素,依然认为影响因素与决策结果是一一对应的关系,依然没能把参与人所处社会环境等因素纳入到其模型之中,因而不能准确地描述现实中人的决策行为,其结论也仅仅具有理论意义而缺乏政策含义。

5.3 进化博弈理论局部动态分析方法的现实性

进化博弈理论利用达尔文“优胜劣汰”的生物进化论、经典博弈理论并结合心理学的研究成果,从西蒙提出有限理性(Bounded Rationality)的参与人群体出发,通过对群体行为的研究进一步得出参与人个体的行为。进化博弈理论跨越了完全理性的“经济人”与有限理性的“社会人”的鸿沟,实现了经济学研究方法革命性的突破。与传统均衡分析法相比,进化博弈理论的局部动态分析方法在以下几个方面独具特色。

5.3.1 局部动态分析法的均衡观

传统的均衡分析方法认为完全理性参与人能够对环境的任何变化作出迅速的最优反应,因而,经济系统是常常处于均衡状态的,分析参与人的行为只需要研究均衡结果,并以此来预测经济人的行为,通过比较不同均衡结果来寻找系统达到均衡的条件。这种处理方法为了数学上处理的方便而撇开现实中“因素互动”而分别考察单个因素对均衡的影响,使得理论更加缺乏现实基础。进化博弈理论则完全摒弃传统理论中非现实的“理性人”假定,直接从有限理性参与人群体出发而提出的一种全新的研究方法----局部动态法。局部动态法把经济系统达到均衡结果的过程纳入到其模型之中,认为经济系统达到均衡需要一个长期的渐进过程,均衡结果依赖于达到均衡的过程,也就是说任何一个结果都是路径依赖的,它与混沌经济学完全动态的研究方法具有某种程度的相似之处。

5.3.2 局部动态法的时间观

传统的均衡分析法并没有纳入因素互动关系并且理性计算是不需要时间的,所以得出经济系统常常是均衡的结论。进化博弈理论的局部动态法一个显著特征就是把参与人的决策过程时间及因素互动的时间纳入到其基本模型之中,强调系统达到均衡的过程,并认为经济系统由于受到各种互动行为及互动因素的影响,有些系统达到均衡可能只需要很短的时间,有些系统达到均衡可能需要很长的时间,有些系统可能无法达到均衡。时间因素对经济学研究有着非常重要的意义,如均衡分析法无法考虑宏观经济政策中“时滞”使得许多实施时有效的政策在发生作用时却出现了与原意相反的结果。时间是度量政策效率的一个很重要的因素,如果不考虑时间因素有些政策可能很有效率,但纳入时间因素,一些需要太长时间才能使系统达到意愿均衡的政策可能根本就没有效率。进化博弈理论把时间纳入到模型分析中并充分应用数学中的相图来描述经济系统达到均衡的路径,这样有利于决策者控制经济系统使之朝向既定的目标前进,也有利于决策者寻找能够最大限度地促进系统向意愿均衡转化的因素,使系统尽快达到有效率的均衡。

5.3.3 局部动态法的均衡选择观

新古典经济学研究的逻辑有理性就有均衡,然后在既定均衡下通过对不同均衡的比较来寻找系统达到不同均衡的条件,即比较静态法,最后结合条件找出希望达到的均衡,因此,该理论不存在真正意义的均衡选择问题。经典博弈理论提供的分析方法在多数情况下都存在其自身所无法处理的多重均衡问题。如老鹰与鸽子博弈及系统选择博弈中多重均衡问题。进化博弈理论的局部动态法引入突变因素就能够较好地解决了多重均衡的选择问题,在老鹰与鸽子博弈中,尽管全是老鹰(全是鸽子)都是均衡的,但这两个均衡都极不稳定即都不是进化稳定均衡,一旦有鸽子(老鹰)突变者进入该系统就会使系统偏离,随着时间的推移而使得系统趋向于混合策略进化稳定均衡即一半鸽子一半老鹰(该均衡是一个全局吸引子);在系统选择博弈中经典博弈理论无法解释系统最终会趋于哪一个均衡,局部动态法引入了突变因素就能够很好地解决了均衡选择问题,即系统最终会趋于哪一个均衡依赖于系统的初始状态即路径依赖。进化博弈理论的基本均衡概念----进化稳定均衡描述的是当经济系统一旦进入到某一均衡的吸引域内时,系统就会对其他的突变策略具有一定程度(即在突变边界内)的抵抗力。

5.3.4 局部动态法的特殊性

新古典经济学与经典博弈理论均衡分析法都是以单个消费者、单个生产者、单个市场为研究对象来考察参与人的最优决策行为,并由此研究整个社会的资源配置问题。然而它们却碰到了如何由个体行为转化到群体行为的困难,因为这种转化过程涉及到各种互动因素的影响。一个明显的例子是经典博弈理论中囚徒困境博弈,在该博弈中两个囚徒都从个体理性出发,但得到了集体非理性均衡的结论。也就是说,均衡分析法根本无法实现从个体行为向集体行为的过渡,在此框架内寻找宏观经济的微观基础的困难是非常大的。进化博弈理论的局部动态法则从人的社会性出发,利用系统论的处理方法来看待参与人的决策行为。该理论直接以参与人的群体为其研究的逻辑起点,在考虑到影响参与人行为的社会因素、文化因素、民族习俗及个体生活习惯等因素的基础上进一步考察群体中有限理性个体的行为互动关系,很巧妙地避开由个体行为向集体行为转化问题,因而能够更加真实地反应现实人的决策过程及其决策结果。

六、结论

进化博弈理论是经济学领域的前沿理论,它来源于对生态现象的研究,虽然该理论应用于经济分析的时间不长,但它为经济学研究提供了一个全新的分析方法,较好地克服了新古典经济学及经典博弈理论中理性假定及多重均衡的困难。并且,应用进化博弈理论来研究经济系统能够获得比传统理论更准确的结果,能够更加现实地解释经济现象,因而在短期内为多数经济学家所接受。从某种意义上说引入进化博弈理论局部动态法来分析经济中参与人的行为是经济学研究方法的一次创新。

注释: ①本文把源于冯·诺意曼和摩根斯藤经纳什发展而成的博弈理论称之为经典博弈理论。 ②即无性生殖,这样假定的意思就是说后代继承其母体的策略,并且永远不改变,当然用于研究人类的行为时,需要作相应的调整。 ③所谓近视调整即是指参与人不管未来怎么样,只知道使当前的支付最大化 ④ 经典博弈理论中每一个参与人都有特定的博弈对象,并且,在重复动态博弈中,后行动者通过观察先行动者的理而利用贝叶斯法则来修正自己的先念信念,然后,在此信念下选择使自己获得最大支付的策略。 ⑤好的策略即是指能够获得较高支付的策略。 ⑥所谓严格纳什均衡即是严格占优纳什均衡。给定对手选择的情况下,每个人都通过选择严占优的策略而组成的纳什均衡。 ⑦事实上,这与Selten提出的颤抖手均衡概念具有相似性,所谓颤抖手均衡是指一个战略组合,只有当它在允许所有参与人都可能犯错误时仍是每一个参与人的最优战略的组合时才是一个均衡,其严格定义可以参阅张维迎的《博弈论与信息经济学》。其中的颤抖或者犯错误与进化稳定策略中的突变因素有差不多的含义,但它们之间存在本质上的不同。 ⑧由模仿者动态方程进行支付变换,可得。 ⑨这一点我们可以从博弈论一个著名的捐款----回赠实验中看出,募捐者要求每一个人都自愿捐款,最终募捐者以3倍于捐款总额的钱平均分派给每个捐款者,为了使得博弈能够分析下去,募捐者要求自愿捐款时每个人都不得与其他人讨论,否则该博弈就无法进行下去,因此,本文称博弈论中的互动是一种沉默互动而非社会互动。这个实验充分体现了古典经济学及博弈论研究对象上的一致性,即它们都是研究单个个体的行为而排除了人的一个重要特征----社会性。参考文献

[1] 王则柯(1999):《博弈论平话》,中国经济出版社。

[2] 张维迎(1999):《博弈论与信息经济学》,上海三联出版社。

[3] 张良桥,冯从文(2001):《进化稳定均衡与纳什均衡:兼谈进化博弈理论的发展》,《经济科学》,3,103-111。

[4] 张良桥(2001):《理性与有限理性:论经典博弈理论与进化博弈理论之关系》,《世界经济》,8,74-78。

[5] 张良桥(2003):《论进化稳定策略》,《经济评论》,2,70-74。

[6] 张良桥,郭立国(2003):《论模仿者动态》,《中山大学学报自然科学版》,3。

[7] 杨小凯(2000):《新兴古典经济学和超边际分析》,中国人民大学出版社。

[8] 青木昌彦, 奥野正宽(1999):《经济体制的比较制度分析》, 魏加宁等译, 北京: 中国发展出版社.

[9] Allais, M., (1952): The foundations of a positive theory of choice involving risk and a criticism of the postulates and axioms of the American school, in expected utility hypotheses and the Allais Paradox, edited by M. Allais and O. Hagen, Dordrecht: Teidel.

[10] Börgers, T. and R. Sarin (1997): Learning Through Reinforcement and Replicator Dynamics, Journal of Economic Theory, 77, 1-14.

[11] Börgers, T. and R. Sarin, (1995): “Learning through Reinforcement and Replicator dynamics”, Mimeo University College London.

[12] Conlisk, J.(1980): Costly Optimizers Versus Cheap Imitators, Journal of Economic Behavior and Organization, 1980, (1): 275-293.

[13] Cowen , Tyler, and Randall Kroszner, The Development of the New Monetary Economics, Journal of Political Economy , 1987, (95): 567-590.

[14] Crawford, Vincent, P. (1989): “An Evolutionary explanation of Van Huyck. Battalio, and Beil’s Experimental Results on Coordination,”Manuscript, Department of Economics, University of California, San Diego.

[15] Daniel Kahneman and Amos Tversky (1979):Prospect theory: An analysis of decision under risk, Econometrica, 1979, (47), 263-291.

[16] Foster, D., and P. Young.(1990) Stochastic Evolutionary Game Dynamics, Theoretical Population biology, (38): 219-232.

[17] Fudenberg, D. and C. Harris (1992): Evolutionary Dynamics with Aggregate Shocks, Journal of Economic Theory, 1992, (57): 420-441.

[18] Jones, R.. The Origin and Development of Media of Exchange, Journal of Political Economy, 1976, (84): 757-775.

[19] Kahneman, D. and A. Tversky(1974) : judgment under uncertainty: heuristics and biases, Science, 185, 1124-1131.

[20] Kahneman, D. and A. Tversky(1979) : Prospect theory: An analysis of decision under risk, Econometrica, 47, 263-291.

[21] Kandori, M. G. Mailath, and R. Rob (1993): Learning, Mutation, and Long-run Equilibria in Games, Econometrica, 61, 29-56.

[22] Kreps. D., and Wilson,(1982): Signaling Games and Stable equilibrium, Econometrica, 50, 863-894.

[23] Lewontin, R. C. (1960): Evolution and the Theory of Games. Journal of Theoretical. Biology. 1, 382-403.

[24] Maynard Smith, J. and G. R. Price.(1973): “The Logic of Animal Conflicts”, Nature, , (246): 15-18.

[25] Nash, Jr. John F.(1950), The Bargaining Problem. Econometrica.

[26] Nash, Jr. John F.(1951), Noncooperative games, Annals Mathematics 54.

[27] Schelling, T. (1960): The Strategy of Conflict, Harvard University Press, Cambridge, MA.

[28] Schelling, Thomas(1960), Strategy of Conflict, Harvard U. Press.

[29] Selten, P. (1978): The chain store paradox,Theory and decision 9, 127-159.

[30] Selten, R. (1980): A Note on Evolutionarily Stable Strategies in Asymmetric Games Conflicts, Journal of Theoretical. Biology. 84, 93-101.

[31] Selten, R.(1975), Reexamination of the Perfectness Concept for Equilibrium Points in Extensive Games, International Journal of Game Theory, 4, 25-55.

[32] Selten, R., (1965): Spieltheoretische Behandlung Eines Pligopolmodells mit Nachfagetragheit, Zeitschrift fur die gesamte Staatswissenschaft, 12, 301-324.

[33] Simon, H. A., (1955): A behavioral model of rational choice, Quarterly Journal of Economics, 69,99-118.

[34] Skyrms, Brian (1986): Deliberational Equilibria, Topoi, 5, 59-67.

[35] Smith, V. L. (1979): Indirect revelation of the demand for public goods: An overview and critique, Scottish Journal of political economy, 25, 183-189.

[36] Swinkels, J. (1993): Adjustment Dynamics and rational Play in Games, Games and Economic Behavior, .5, 455-484.

[37] Taylor, P. D. and L. B. Jonker.(1973): Evolutionarily Stable Strategy and Game Dynamics, Mathematical Social. Science (40): 145-156.

[38] Tversky, A. and D. kahneman(1992): Advances in prospect theory: cumulative representation under uncertainty, Journal of risk and uncertainty, 5, 297-323.

[39] Von Neumann, John and Oskar Morgenstern(1944), Theory of Games and Economic Behavior, Princeton U Press.

[40] Weitzman, Martin(1984): The Share Economy.Cambridge, Harvard University Press.

博弈论的方法第2篇

预算是“利用企业现有资源增加企业价值的一种方法”。作为一种系统化的现代企业管理模式,预算管理兼具计划、控制、激励等多种管理功能于一体,在现代大中型企业的管理工作中发挥着不可替代的作用。委托关系不仅在所有者与管理者之间存在,而且也存在于企业内部的管理层与执行层之间,这种委托关系带来的问题是双方目标的不一致和信息的不对称。在预算管理包括预算编制、预算调控和预算考评的过程中,目标的背离和严重的信息不对称有碍预算功能的发挥,甚至会引发控制、激励等管理职能的失效,常见的有如激励不足和预算松弛等问题。本文对预算松弛现象基于博弈论的视角进行分析并提出相关对策建议。   []

二、博弈论相关理论分析

(一)博弈论相关理论

博弈论是在一定的假设前提下,基于经济、管理以及数学相关知识对事物过程的系统分析。博弈包括参与人、策略和支付三要素。所谓参与人即参与博弈的各主体方,具有经济理性和选择的能动性特点。策略分别是各参与方可供选择地策略组合,也即是策略空间。支付又叫得益,是参与人在各博弈方选择特定策略条件下的收益或亏损(可正可负),是参与人选择策略的依据和主要目标,通常用量化的效用水平或期望效用表示。

博弈论分析基本假设:一是理性人假设,即参与博弈各方都是理性的,通过理性决策使自己的收益最大化;二是博弈者理性为共同认识,即每个博弈者都知道博弈参与者是理性的,这种相互知道能无限推演循环。

按照不同标准可以对博弈进行不同类型划分。依据决策是否同时和博弈回合数可以将博弈划分为静态博弈和动态博弈;依据信息完全与否可以将博弈划分为完全信息博弈和不完全信息博弈。依据其他标准也可进行不同分类。常见分类及达到的均衡如图(1)所示。  

(二)预算及委托理论

全面预算是由经营预算、长期投资预算、筹资预算等一系列的预算构成,内容涉及生产、采购、销售、财务等领域。由于内容复杂,企业可以根据成本允许选择不同的编制方法。常用的预算编制分类方法有增量预算法和零基预算法;固定预算法和弹性预算法;定期预算法和滚动预算法等。预算具有落实战略目标,明确经营目标,控制经营活动,明确考评依据,激励各层员工等作用。但在实际管理过程中,由于预算决策层、预算管理层和预算执行层之间存在信息不对称以及目标不一致等情况,致使预算管理并不能完全发挥理论上的功用,会出现激励不足或激励不当(包括预算松弛和操纵预算管理)等问题。

委托是现代企业制度的典型特征,是市场经济发展到一定程度专业化分工的结果。正是这种契约关系的存在,使激励制度成为一种必要的管理措施。因为委托方和方之间存在目标的不一致性,在对方进行监管的同时,为使监管成本最低,有必要采取相关的激励措施以促使双方目标尽可能的一致,并为委托方带来最大的收益。在此过程中,因为亲身参与管理执行,执行层较管理层拥有更多的信息,管理层较所有者拥有更多的信息,所以使博弈更成为一种可能。

三、预算编制博弈分析

(一)预算编制路径

(1)预算决策层下达目标。是企业最高决策层根据战略目标,基于历史情况,结合预期经济形势以及其他相关约束条件,制定下一个预算期内的预算目标,预算委员会下达到各预算责任执行中心。

(2)提出预算方案。预算执行中心会出于自身的经济利益可能会虚报,包括高报支出或低报实际生产经营能力。高报支出会带来较大的支出弹性和在职消费,低报生产能力会减小考核压力并能轻易完成考核目标以获取超额奖励。执行中心虚报的同时也存在着相关成本,包括隐瞒真相成本以及隐瞒被发现后遭受处罚成本。

(3)预算方案审查平衡。针对各中心上报的详细预算方案审核汇总,结合战略目标、决策计划以及实际约束条件,进行平衡调整,提出修改建议下达给原上报中心。预算委员会的策略选择空间为批准通过和拒绝。针对执行中心的“实报”策略,委员会采取“批准”策略,带来的是正常收益;针对“实报”行为,委员会采取“拒绝”策略,这种情况对于理性的博弈者来说不会存在;针对“虚报”行为,委员会采取“批准”策略,会带来额外损失;针对“虚报”策略,委员会采取“拒绝”策略,同样带来正常收益,但会付出更多的审核成本。

(4)预算下达执行。各预算中心根据预算委员会下达的调整建议与其进行协商并调节,最后经审议通过后依照执行。

(二)编制过程博弈分析

(1)模型假设。博弈各方都是理性经济人,且“理性”为共同认识;参与博弈双方的信息是不完美的,即博弈者对对方的收益和策略并不是完全了解;参与双方之间的策略选择有先后顺序,可看作是两阶段的动态博弈。

(2)博弈分析。预算执行中心以A表示,上报预算方案时其策略空间为{a1,a2}, a1表示虚报,a2表示实报,且为私人类型,即执行中心知道取值,而预算委员会仅知道取值概率,P(a1)=q, P(a2)=1-q。执行中心虚报并隐瞒成功时可获得额外收益R(R≥0)虚报的额外成本为C(易知R>C≥0),隐瞒被发现遭受处罚F=θR(0<θ<1)。实报时额外收益为0,额外成本亦为0。

运用海萨尼转换时,虚拟参与人以N表示,其策略空间{n1,n2},表示自然发出的执行中心想传递的信号空间。n1表示自然发出的执行中心不刻意隐瞒虚报行为的信号,n2表示自然发出的执行中心声称如实申报采取措施积极隐瞒虚报行为的信号。

预算委员会以B表示,在收到自然发出信号mi(i=1,2)后,可选择策略空间为{b1,b2},表示批准执行中心预算申请,表示拒绝执行中心预算申请。预算委员会在进行审核时,可选择一般力度审核,审核成本为C1(C1>0),也可进行大力度审核,成本为C2(C2>C1>0)。当预算委员会审查出执行中心存在虚报行为时,可得到最高决策层的奖励J=γF=γθR(0<γ<1)。

当a= a2时,必有n= n2,因为预算执行中心作为理性的经济人,不会在如实申报时对外表示 出虚报行为。

根据上述假设,预算编制过程中的不完全动态博弈可用如下博弈决策树表示。见图(2)。??????????????

分别以U1,U2表示预算执行中心,预算委员会效益在不同策略选择下的水平为:

U1(a1,n1,b1)=- C, U2(a1,n1,b1)=- C1

U1(a1,n1,b2)=- C, U2(a1,n1,b2)=- C1

U1(a1,n2,b1)=R - C, U2(a1,n2,b1)=- C1

U1(a1,n2,b2)=- F - C,U2(a1,n2,b2)=J - C2

U1(a2,n2,b1)=0, U2(a2,n2,b1)=- C1

U1(a2,n2,b1)=0, U2(a2,n2,b1)=- C2

通过对上述博弈模型分析,得出如下结论:

(1)当γ≤(C2-C1)/(qθR)时,混同均衡{n*(a),b*(n),P(a∣n)}是该博弈的子博弈精炼贝叶斯-纳什均衡。预算委员会于混同策略的最佳反应是b(n)≡b1,预算执行中心最佳反应是混同策略n(a)≡n2。此时预算执行中心的最佳策略均对外声称如实申报预算,而预算委员会的最佳策略是实施一般力度审查。   []

(2)当γ>(C2-C1)/(qθR)时,博弈双方交替使用混同策略和分离策略。预算执行中心的分离策略导致预算委员会的混同策略b(n)≡b1;而对于b(n)≡b1,预算执行中心又会选择混同策略n(a)≡n2;对于n(a)≡n2,预算委员会会选择b(n1)=b1,b(n2)=b2的分离策略;对于b(n1)=b1,b(n2)=b2的分离策略,执行中心又会选择对于n(a)≡n2的混同策略。

博弈论的方法第3篇

[关键词]博弈论 经典博弈模型 博弈行为 博弈决策

“博弈论”原本是数学的一个分支,但由于它较好地解决了对竞争等问题的可操作性分析,成为经济学中激荡人心的一个研究领域。可以说,“博弈论”已经改变了经济学的传统轮廓线。从对“博弈论”简要、通俗的介绍中可以发现,我们身边充满了博弈,或者说,我们身边的许多行为、现象都可用博弈来概括。“博弈论”不仅属于经济学,也理应属于社会学、政治学、心理学、历史学等,这些学科也有理由分享“博弈论”那旖旎的学术风光和精细的分析技巧。“博弈论”的英语原文是Game Theory,直译过来就是游戏论、运动论或竞赛论。譬如在足球比赛中,双方都想在努力巩固防守的同时,积极进攻以置对方于“死地”。这种行为就是一种博弈。“弈”在汉语中是下棋的意思,下棋中的双方行为特征也如同足球比赛中双方的行为。当然,扩展开来讲,企业之间的竞争、国家之间的角力等等,都是“游戏”,只是游戏的内容不同而已。

一、博弈简介

“博弈论”就是分析博弈行为和博弈决策的一门科学。

今年的诺贝尔经济学奖,已于前不久为“博弈论”研究专家罗伯特・奥曼和托马斯・谢林所获得,1994年度和1996年度的诺贝尔经济学奖,也分别由纳什、泽尔滕、海萨尼、莫里斯和维克瑞等“博弈论”专家分享。如此众多的“博弈论”研究专家的频频获奖,凸现了“博弈论”在主流经济学中日益重要的地位。

“博弈论”原本是数学的一个分支,但由于它较好地解决了对竞争等问题的可操作性分析,成为经济学中激荡人心的一个研究领域。可以说,“博弈论”已经改变了经济学的传统轮廓线。

我国古代有个“田忌赛马”的故事,说的是齐威王与大将田忌各出三匹马,一对一比赛三场,由于齐威王的最优、次优和较差的三匹马分别跑得比田忌的三匹马快,所以田忌总是以0∶3告负。后来田忌的谋士孙膑给田忌出主意,让最差的马去与齐威王最快的马比,而让最优的马去赢齐威王次优的马,让次优的马去赢齐威王最差的马,这样便以2∶1取胜。但我们还可进一步设想,如果齐威王知道了田忌的花招后,便会在以后的比赛中也更改出马的次序,当然田忌的出马次序也应改动。双方的出马次序怎样才是最合理的呢?这便是“博弈论”更深一层次研究的问题了。

二、一个非技术性的定义

博弈即一些个人、队组或其他组织,面对一定的环境条件,在一定的规则下,同时或先后,一次或多次,从各自允许选择的行为或策略中进行选择并加以实施,各自取得相应结果的过程。从定义我们可以看出,规定或定义一个博弈需要设定下面四个条件。

1.博弈的参加者。即在所定义的博弈中究竟有哪几个独立决策、独立承担结果的个人或组织。

2.各博弈方各自可选择的全部策略或行为的集合。即规定每个博弈方在进行决策时,可以选择的方法、做法或经济活动的水平、量值等。

3.进行博弈的次序。在现实的各种策略活动中,当存在多个独立决策方进行决策时,有时候需要这些博弈方同时作出选择,以为这样能保证公平合理,而很多时候各博弈方的决策又有先后之分,并且有时一个博弈方还要作不止一次的决策选择。

4.博弈方的得益。对应于各博弈方的每一组可能的决策选择,都应有一个结果表示该策略组合下各博弈方的所得或所失。

以上四个方面是定义一个博弈时必须首先设定的,确定了上述四个方面就确定了一个博弈。博弈论就是系统研究可以用上述方法定义的各种博弈问题,寻求在各博弈方具有充分或者有限理性、能力的条件下,合理的策略的选择和合理选择策略时博弈结果,并分析这些结果的经济意义、效率意义的理论和方法。

三、博弈的结构和博弈的分类

由于博弈研究的问题多种多样,因此博弈模型相互之间的差别可能会很大。这些差别可以理解为都是博弈问题的结果差别。当博弈结构有差别时,博弈的结果和分析方法往往也有不同,因此对博弈的结构特点有所了解是很有价值的,在此我们提出博弈论问题的分类和博弈理论的结构。

1.博弈中的博弈方:博弈中独立决策、独立承担博弈结果的个人或组织为博弈方。因此我们把博弈方分为“单人博弈”、“两人博弈”和“多人博弈”。这里的“单人博弈”和“两人博弈”,并不一定是自然人,而是指前面所说的博弈方,既可以是个人,也可以是经济社会组织。

2.博弈中的策略:博弈中各博弈方的策略内容称为“策略”。

3.博弈中的得益:得益即参加博弈的各个博弈方从博弈中所获得的利益,它是各博弈方追求的根本目标,也就是他们行为和判断的主要依据。

(1)零和博弈:它是常见的博弈类型,同时也是被研究得最早、最多的博弈问题。

(2)常和博弈:它也是很普遍的博弈类型。常和博弈可以看作零和博弈的扩展,零和博弈则可以看作常和博弈的特例。

(3)变和博弈:零和博弈和常和博弈以外的所有博弈都称为“变和博弈”。

(4)博弈的过程:博弈的过程也是博弈结构的重要方面。根据博弈过程方面的这些差异,博弈问题通常分为“静态博弈”、“动态博弈”和“重复博弈”几个大类。

①静态博弈:所有博弈方同时或可看作同时选择策略,采取行动的博弈是静态博弈。

②动态博弈:指博弈方的选择和行动有先后之分,后行者可以根据先行者的策略选择来决定自己的策略。

③重复博弈:所谓重复博弈实际上就是同一个博弈反复进行所构成的博弈过程。构成重复博弈的一次性博弈也成为“原博弈”或“阶段博弈”。

我们研究的大部分是重复博弈的原博弈都是静态博弈,或者说是由静态博弈构成的。这种由同样一些博弈方,在完全同样的环境和规则下重复进行的博弈,在现实中有很多实际的例子。如:体育竞技中的多局制比赛、商业中的回头客问题、企业之间的长期合作或竞争等等,如果不考虑环境条件方面的细小变化,都可以看作是重复博弈问题。

5.博弈的分类和博弈理论的结构

博弈结构这些方面的差异对博弈结果和博弈分析都有重要的影响,而且博弈分类相互之间都是交叉的,并不存在严格的层次关系,但我们还可以根据各种分类对博弈分析方法影响程度的大小排除大致的次序。

(1)是分为合作博弈与非合作博弈。如果各博弈方能达成某种有约束力的契约或默契,以选择共同的策略,此种博弈就是合作博弈。反之,就属于非合作博弈。

(2)是分为零和博弈、常和博弈与变和博弈。

(3)是分为静态博弈与动态博弈。

(4)是分为完全信息博弈与不完全信息博弈。在前一种博弈中,每一个参与者都拥有全部的相关信息,只拥有部分相关信息的便属于后一种博弈。

四、“博弈论”中的经典博弈模型

根据博弈定义,小到企业之间的竞争和合作,国家之间的倾销反倾销、制裁和报复等,都有可以归结为博弈问题。“博弈论”中有一些由点及面、发人深思的经典案例,这些案例不仅使专业研究人士如醉如痴,也使一些普通民众兴致盎然;不仅成为“博弈论”中的一道亮丽风景,也是整个经济学领域中的学术奇葩。

1.囚徒困境

假设警察局抓住了两个合伙犯罪的嫌疑犯,但获得的证据并不十分确切,对于两者的量刑就可能取决于两者对于犯罪事实的供认。警察局将这两名嫌疑犯分别关押以防他们串供。两名囚徒明白,如果他们都交代犯罪事实,则可能将各被判刑5年;如果他们都不交代,则有可能只会被以较轻的妨碍公务罪各判1年;如果一人交代,另一人不交代,交代者有可能会被立即释放,不交代者则将可能被重判8年。

对于两个囚徒总体而言,他们设想的最好的策略可能是都不交代。但任何一个囚徒在选择不交代的策略时,都要冒很大的风险,一旦自己不交代而另一囚徒交代了,自己就将可能处于非常不利的境地。对于囚徒A而言,不管囚徒B采取何种策略,他的最佳策略都是交代。对于囚徒B而言也是如此。最后两人都会选择交代。因此,囚徒困境反映了个体理与集体理之间的矛盾、冲突。

囚徒的困境博弈的重要意义,在于类似的情况在社会经济活动中具有很大的普遍性,在市场竞争的各个领域和方面,在资源利用和环境保护,以及政治、军事和法律等各个领域问题中,都有类似囚徒困境的现象。

2.智猪博弈

假设猪圈里有一大一小两只猪,猪圈的一头有一个猪食槽,另一头有一个控制猪食供应的按钮,揿一下按钮会有10个单位的猪食进槽。若小猪去揿,大猪先吃,大猪可吃到9个单位,小猪揿好后奔过来,则只能吃到1个单位;若大猪去揿,小猪先吃,小猪可吃到6个单位,大猪吃到4个单位;若同时去揿,奔过来再同时吃,大猪可吃到7个单位,小猪吃到3个单位。在这种情况下,不论大猪采取何种策略,小猪的最佳策略是等待,即在食槽边等待大猪去揿按钮,然后坐享其成。而由于小猪总是会选择等待,大猪无奈之下只好去揿按钮。这种策略组合就是名闻遐迩的“纳什均衡”。它指的是,在给定一方采取某种策略的条件下,另一方所采取的最佳策略(此处为大猪揿按钮)。

智猪博弈现象在日常生活中也是司空见惯的。如大股东行使监督上市公司的职责,而小股东则坐享这种监督带来的利益,即所谓“搭便车”;爱清洁的人经常打扫公共楼道,其他人搭便车;等等。

3.斗鸡博弈

两只公鸡面对面争斗,继续斗下去,两败俱伤,一方退却便意味着认输。在这样的博弈中,要想取胜,就要在气势上压倒对方,至少要显示出破釜沉舟、背水一战的决心来,以迫使对方退却。但到最后的关键时刻,必有一方要退下来,除非真正抱定鱼死网破的决心。

这类博弈也不胜枚举。如两人反向过同一独木桥,一般来说,必有一人选择后退。在这种博弈中,非理性、非理智的形象塑造往往是一种可选择的策略运用。如那种看上去不把自己的生命当回事的人,或者看上去有点醉醺醺、傻乎乎的人,往往能逼退独木桥上的另一人。还有夫妻争吵也常常是一个“斗鸡博弈”,吵到最后,一般地,总有一方对于对方的唠叨、责骂装聋作哑,或者干脆妻子回娘家去冷却怒火。在企业经营方面,在市场容量有限的条件下,一家企业投资了某一项目,另一家企业便会放弃对该项目的觊觎。

博弈论的方法第4篇

博弈理论实质是将供求理论借鉴运用的物理力学均衡理论及概念再移植到竞争理论的研究中,研究的是决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题。博弈论研究当某一主体的决策既受到别的主体的决策影响,而且该主体的相应决策又反过来影响到别的主体时的决策问题。博弈中作为一个整体各个主体的选择相互影响,对单个消费者或企业来说决策时不仅依赖于自己的选择,并且依赖于具体某个或某些主体的选择,最优选择是某些主体选择的函数。

博弈论的基本概念包括:参与人、行为、信息、战略、支付函数、结果、均衡。参与人是指博弈中选择行动利益最大化的决策主体家庭、企业或国家;

行动是指参与人的决策变量;

战略是指参与人选择行动的规则,告诉参与人在什么时候选择什么行动;

信息是指参与人在博弈中的知识特别是有关对手的特征和行动的知识;

支付函数是参与人从博弈中获得的效用水平,是所有参与人战略或行动的函数,是每个参与人真正关心的东西;

结果是指博弈者感兴趣的要素的集合;

均衡是所有参与人的最优战略或行动的组合结果。

而上述概念中参与人、行动、结果统称为博弈规则,博弈分析的目的就是使用博弈规则决定均衡。可见博弈理论并没有跳出竞争的范畴。

弈论理论上博弈论分为合作博弈和非合作博弈,区分是博弈者之间是否能采取合作策略。合作博弈是博弈者能够通过谈判达成有约束性的契约或默契以协调行为相互采取一种合作策略,无法通过谈判达成契约或默契为非合作博弈;

还可以根据持续的时间和重复的次数分为静态博弈与动态博弈;

而根据博弈弈者所掌握的信息的程度,还可将博弈分为完全信息博弈与不完全信息博弈,以及完备信息博弈与不完备信息博弈,确定博弈与不确定博弈等。

非完全竞争中的均衡性即合作博弈论(奥曼博弈)、完全竞争中的均衡性即非合作博弈论(纳什博弈)。合作博弈中奥曼提出了策略型与广义型(扩展型)等基本的博弈模型、解的概念和分析方法,建立“交互的决策论”为“最优理性决策”服务,即研究决策者的决策行为、作用条件及决策的均衡问题。

二、奥曼合作博弈论创立及一般理论

数学家约翰·冯·诺伊曼和经济学家奥斯卡·摩根斯坦合作出版的《博弈论与经济行为》一般被认为是博弈论产生的标志,概括了行为主体的典型行为特征,提出博弈模型、解的概念和分析方法。奥曼认为博弈是“交互的决策论”,即研究决策者的决策行为、作用条件及决策均衡问题,即决策者间决策行为形成的互为影响关系。因此决策主体必须考虑对方的反应,所以用“交互的决策”来描述博弈论。如果仅有一个决策者就产生最优化问题,而在多个参与者的博弈中,决策者的决策结果取决于众多决策者的交互决策作用。

奥曼认为就社会科学的理性方面而言博弈论是概括或“统一场论”,不是利用个别、特定结构讨论具体问题,而是应用于所有交互情形的一套方法,并进而探讨在每一具体应用中所导致的结果。

奥曼将“连续统”观点引入完全竞争行为及经济模型,使完全竞争的个量不影响总量的情况限制在仅存在有限多的参与者,因此个别参与者对经济的影响也就不能被忽视。连续统可看作接近于存在许多但是数量有限的粒子状况。奥曼指出竞争分配的核心和模式与企业连续统的市场相一致,并通过精确表达完全竞争观点的连续统模型,使模型改进为经济理论的基本准则。

奥曼看来博弈论和经济理论中最显著而独有的现象是竞争的价格均衡与对应的博弈的解概念间的关系,直观上看等价性原理是说市场价格的建立是从在完全竞争市场上运转的基本力量自然产生。

奥曼还利用参与者的连续统建立的垄断和寡头垄断竞争模型,以及公共经济学基于经济活动和政治过程相互交织的税收模型,如表决、固定价格模型等。

重复博弈即同样结构的博弈重复,每次博弈称为阶段博弈,是动态博弈的重要内容。奥曼认为完全信息的重复博弈论与人之间相互作用的基本形式的演化相关,目的是解释诸如合作、报复、威胁等现象。博弈论和新古典经济学模式的现象,可能一开始看起来非理性。奥曼定义“强均衡”概念,即没有任何参与者可以单方面改变决策来获益的情形,指出重复博弈的强均衡与一次性博弈的核心相一致。

合作博弈发展的鼎盛期也是非合作博弈的开创期。合作博弈理论直接讨论合作的结果与利益的分配,隐含的假设是存在一个在参与者间可以自由转移的交换媒介,每个参与者的效用可转移。奥曼把“可转移效用”理论扩展到一般的非转移效用理论,发展并加强了可转移效用和非转移效用的合作博弈论。

非合作博弈论的重点是对个体的战略选择,即每个参与者如何博弈,或者说选择什么策略达到目标。

三、纳什非合作博弈论的无意义性

不知是否是基于本文同样的认识或观点,纳什均衡既遭到冯·诺依曼的断然否定,还受到爱因斯坦的冷遇都不是没有道理的。纳什于1950和51年发表两篇关于非合作博弈论的论文,证明非合作博弈及其均衡解的存在,即所谓纳什均衡。然而,无论纳什的囚犯两难处境也好,还是价格战博弈也罢,其分析的非合作博弈均衡状态无论方法对错其实质是完全竞争均衡状态的分析,不过是竞争与非合作博弈的名称转换而已。

纳什的纳什均衡或非合作博弈论实际是完全竞争的均衡,证明的非合作博弈均衡解的存在,不过就是完全竞争的均衡解。奥曼将博弈概念从竞争概念中相对独立出来,而纳什又转了回去,难怪遭到冯·诺依曼的断然否定。

事实上,合作博弈本来仅就是竞争的一种形式即竞争对手的相互妥协、协调、默契;而非合作博弈的实质就是竞争,与其说存在非合作博弈不如直接说完全竞争。合作博弈实际是非完全性市场竞争,是竞争的一个特殊部分;而非合作博弈就是完全性市场竞争,因此也就根本没有存在于博弈理论中的价值。

目前经济学界谈到博弈论的非合作博弈,也就是各方在给定的约束条件下如何追求各自利益最大化,最后达到力量均衡,这实际是人与人之间利益竞争力的均衡。

四、博弈论也并不等同于对策论

博弈论是一种在合作中的竞争、竞争中的合作的交互决策方法,但不能把博弈论简单的归结或称为对策论。博弈是一种对策“场”,而对策是博弈中不同的作用点。

五、博弈理论的扬弃性研究与修正适用

现实中被博弈论的大量数学模型唬着的人不计其数,实际上博弈论不过就是一种分析方法而已,是可以帮助人了解策略性互动中的内在逻辑及构成,并提供一些有用的解决问题的方法,甚至可以说博弈论方法是对哲学思维方法的深化。目前博弈论作为分析和解决冲突与合作的方法和工具,在社会学、政治学、经济学等领域得到广泛应用。实际中如何理解博弈论、如何运用博弈论原理指导经济实践是个值得思考的问题。

价格与产量决策、经济合作和经贸谈判、引进与开发新技术或新产品等,博弈论都是有效的决策工具,至少是一种决策的思路。

国际贸易中的双方如果采取对抗性竞争策略,就会使双方因贸易战受到损害。彼此限制对抗国的产品进口,具体策略是提高关税,限制与对抗反击的结果是谁也没有捞到好处。反之,如果展开合作中的竞争、竞争中的合作,达到博弈均衡,即从互惠互利的原则出发达成减少关税,促进贸易的结果,彼此就都可以从贸易中获益。

博弈论的方法第5篇

博弈论又称为“对策论”,一种使用严谨数学模型来解决现实世界中的利害冲突的理论。由于冲突、合作、竞争等行为是现实世界中常见的现象,因此很多领域都能应用博弈论,例如军事领域、经济领域、政治外交,解决诸如战术攻防、国际纠纷、定价定产、兼并收购、投标拍卖甚至动物进化等问题。

博弈论的研究开始于本世纪,1944年诺依曼和摩根斯坦合著的《博弈论和经济行为》一书的出版标志着博弈理论的初步形成,随后发展壮大为一门综合学科。1994年三位长期致力于博弈论研究实践的学者纳什、海萨尼、塞尔顿共同获得诺贝尔经济学奖,使博弈论在经济领域中的地位和作用得到权威性的肯定。

2.博弈论的基本原理和方法

文献[1][2]用浅白的语言叙述了博弈论的思想精髓和基本概念。文献[3][4]更注重理论上的分析和数学的严谨。概括起来,博弈论模型可以用五个方面来描述

G={P,A,S,I,U}

P:为局中人,博弈的参与者,也称为“博弈方”,局中人是能够独立决策,独立承担责任的个人或组织,局中人以最终实现自身利益最大化为目标。

A:为各局中人的所有可能的策略或行动的集合。根据该集合是否有限还是无限,可分为有限博弈和无限博弈,后者表现为连续对策,重复博弈和微分对策等。

S:博弈的进程,也是博弈进行的次序。局中人同时行动的一次性决策的博弈,成为静态博弈,如齐威王和田忌赛马;局中人行动有先后次序,称为动态博弈,如下棋。

I:博弈信息,能够影响最后博弈结局的所有局中人的情报,如效用函数,响应函数,策略空间等。打仗强调“知己知彼,百战不殆”,可见信息在博弈中占重要的地位,博弈的赢得很大程度依赖于信息的准确度与多寡。得益信息是博弈中的重要信息,如果博弈各方对各种局势下所有局中人的得益状况完全清楚,称之为完全信息博弈(gamewithcompleteinformation),例如齐威王和田忌赛马,各种马的组合对阵的结果双方都不严而喻。反之为不完全信息博弈(gamewithincompleteinformation),例如投标拍卖,博弈各方均不清楚对方的估价。在动态博弈中还有一类信息:轮到行动的博弈方是否完全了解此前对方的行动。如果完全了解则称之为“具有完美信息”的博弈(gamewithperfectinformation),例如下棋,双方都清楚对方下过的着数。反之称为“不完美信息的动态博弈”(gamewithimperfectinformation)。由于信息不完美,博弈的结果只能是概率期望,而不能象完美信息博弈那样有确定的结果。

U:为局中人获得利益,也是博弈各方追求的最终目标。根据各方得益的不同情况,分为零和博弈和变和博弈。零和博弈中各方利益之间是完全对立的。变和博弈有可能存在合作关系,争取双赢的局面。

还有另一类型博弈称为多人合作博弈,例如安理会投票表决,OPEC联合限产保价等问题。这类问题重点放在联盟利益的分配上,它的理论和方法广泛应用于利益损失的共同分担问题。多人合作博弈的研究方法主要是特征函数模型。以个可能的联盟为定义域,特征函数表示各个联盟的得益(N是局中人的数目),它的分配解必须符合一定的合理性和稳定性,它的解的概念也发展成多种多样,包括稳定集、核心、核仁、Shapely值等。解的多样性符合现实世界复杂多样的需要,针对不同的问题选择或创造合适的解的概念是博弈论深入研究的课题。

不管博弈各方是合作、竞争、威胁还是暂时让步,博弈论模型的求解目标就是使自身最终的利益最大化,这种解建立在对方也采取各自“最好策略”为前提,各方最终达到一个力量均衡,也就是说谁也无法通过偏离均衡点而获得更多的利益。这就是博弈论求解的本质思想。

3、博弈论与电力市场

博弈论是研究市场经济的重要工具。电力作为特殊的商品,它的生产、运输、销售和消费也逐渐走向市场化。世界范围内很多国家的电力工业走向放松管制、引进竞争的进程中,遇到很多前所未有的新课题,运用博弈论来分析解决其中一些问题是一个研究方向。用博弈论模拟电力市场,模拟的结果可能更加接近实际,为市场模式设计提供依据。另外,电厂或用电用户作为市场的参与者,可以用博弈论来分析市场,研究如何报价获利最大。

正确运用博弈论关键要针对电力市场的特点正确选择模型和解的概念。例如:力量相当的两个区域电网之间交换功率的情形比较适合用古诺模型和Nash谈判解方法;而自备电厂与公用电网之间的交易可能更适合用Stackleberg模型。还有局中人结盟问题:如何识别合作伙伴,结盟利益如何在联盟内分配。电力市场环境下,电网输电作为一项服务,它的网损、固定资产投资如何在网络使用者之间分担。这些分配问题有不同的概念的解:稳定集,核心,核仁,Shapely值等,如何合理选择或创造最接近实际的解的概念也是面临的课题。

博弈的结果是依赖于拥有的信息,采用什么样的信息披露政策是设计电力市场模式的一个方面。例如:电厂竞价上网,一个成功的报价不仅取决于自己的实力,还有赖于他人如何报价。但是各方往往不清楚互相之间成本、报价等信息,因为这些信息都是各自的商业秘密。如何处理这种信息既不完全也不完美的博弈是一个重要的课题。反过来,博弈的实验结果也为电力市场披露怎样的信息提供依据。

博弈论和电力市场理论都是很年轻的科学,两者都有广阔的发展天地,两者的结合可以互相促进。

4、博弈论在电力市场中的应用

4.1自备电厂与公用电网之间的交易

开放发电市场的进程中,拥有自备电厂的用户是一类特殊的市场参与者,它既是用电用户,也可以是电力的供应者。随着电力市场深入发展和工业的进步,自备电厂将成长为一支生力军。

文献[5]用博弈论来分析评价在分时定价的环境下拥有自备电厂的用户(NCP)对定价的影响作用。NCP既可以从公用电网购电,也可以自己发电来满足自身需求。为解决两者的冲突,作者提出了三种博弈模型:非合作Nash博弈模型,合作博弈模型和超博弈模型。作者构造了三个局中人:公用电网,普通用户,带自备电厂的用户(NCP),并且假设它们的需求函数、边际成本、收益函数等均是线性的,通过数字模拟得出了一些有趣的结果:①NCP的加入促使公用电网降低出售给NCP的电价;②冲突还使普通用户得到更多益处。该文为解决自备电厂与公用电网的相互作用提供了很有用的分析思想。但是尚有三点可以进一步改进:①该文尚未考虑NCP将自己多余的自发电卖给公用电网的情况;②该文将公用电网和NCP置于平等的市场地位可能不符合实际市场,如果公用电网规模很大,NCP数目很多但规模小,考虑Stackerlberg模型更符合两者实际;③该文假设公用电网的目标函数是整个社会利益最大化,而并非是自身利益最大化,这个假设不符合电力市场需要解除管制的发展方向。

文献[6]部分解决了以上问题,它重点放在自备电厂和公用电网相互作用的方式的选择:公用电网回购NCP多余电力(buy-backsystem)或者公用电网收取NCP运转电力的过网费(wheelingcharges)。该文分析了在不同市场环境下,各方的得益情况,得出了一些可能只有用博弈论才能得出的结论。

4.2区域间输电交易分析

互联网间短期电力交换是一种经济运行的手段。白晓民等在文献[7]中应用Nash博弈论来分析简单的两区域系统单时段交易分析,得出双方都可接受的交换功率和交易价格。在此基础上,文献[8]提出了一种两阶段迭代计算方法来处理外部交易计划与内部经济调度的协调。该文所用的博弈模型是二人非零和对策,采取合作型对策,应用Nash谈判公理作为仲裁程序,决策出双方都可接受的交换功率和交易价格。应该指出,白晓民等的分析是基于完全信息的博弈也即博弈双方均对对方在各种情况下的得益了解非常清楚。如果缺少这方面的信息,又应该如何分析处理呢?这个问题值得进一步深入探究。

4.3转运市场中电网的固定成本分摊问题

运转市场中一个难题是网络输电服务定价,这个定价能够给网络使用者一个信号,以达到全网最优化;并且能够补偿网络的投资者,网损、变动成本、固定成本等费用在网络使用者中合理分摊;同时能够正确激励网络增容。节点实时价格(nodalspotprice)制度可以解决网损和网络阻塞问题。但是文献[9]的作者认为节点实时价格制度不能完全回收输电系统的固定投资,为了解决双边贸易中输电系统固定成本公正分摊问题,作者提出了基于多人合作博弈模型,可以计算出逐条线路逐笔交易的分摊费用。文中使用“核仁”作为模型的解。该方法的优点:①使用“核仁”而不用Shapely值,因为“核仁”处于核心,分配值更加稳定和易于被各方接受;②提供了一种激励,减轻线路过载。

4.4基于Pool或PX模式的多边贸易市场

电力市场环境下的博弈具有行动策略随机性、信息隐蔽性,这些特点都给建模和计算造成困难,从而限制了实际应用。各种文献在处理这种不确定信息环境下的决策问题中,通常需要假设或者估计对方的信息,方法各有特色。

在文献[10]作者认为在完全竞争的市场环境下,市场参与者相对于市场规模都显得很小,市场影响力很小。在这种情况下,优化报价决策不需要博弈的思想。文中作者认为电力市场属于不完全竞争市场,单个市场参与者对市场是有影响力的,其模型本质上属于不完全信息的非合作博弈。例如:每个参与者只知道自己的成本信息,而不知道对方的成本等信息。在这种情况下作者提出了这样的一个问题:在无法完全了解对方的信息情况下,参与者如何投标(选择高价投标还是低价投标)才能使自己收益最大。该文通过转化的方式把不完全信息的博弈变为信息完全但不完美的动态博弈来求解。每个市场参与者均对自己的对手可能的出价进行分类,并对每一类的可能性进行概率估计,形成一个概率意义上的期望收益矩阵,用Nash平衡点的概念求解矩阵,得到问题的解。

文献[11][12]作者提出了一种谈判模型。每一个局中人进行决策时,都同时执行以下两个步骤:①对可能的合作对象按照一定的指标进行优先排序;②按照谈判优先顺序,逐一进行讨价还价,谈判的规则与程序是预先设定好的。该文的特色是谈判对象的优先顺序表的形成。排序的准则基于该局中人A对关于他人的信息的了解程度。先分别对其他局中人的成本信息进行分类,并对每一类出现的可能性进行概率估计。然后假设与某局中人B进行合作,互相交换共享所拥有的信息,联合成博弈的一方,剩下的局中人结合为博弈的另一方。这样的博弈模型的Nash平衡点是概率意义上的期望值,作为与B合作的优先指标。对每个局中人都进行一遍以上计算,得到了A的谈判对象优先顺序表。每个局中人都有自己的一张优先顺序表。最后按照预先设定的谈判规则与程序,各方同时进行合作谈判,谈判要解决如何合理分配或均衡比单干多出的利益。

该文关键的一点:正确掌握对方的成本、策略等信息。各方可能从每一次博弈的结果中得到有用的反馈信息,并用这种反馈来更新自己的知识库,提高对他人了认识。遗憾的是作者并没有提到如何实现这样重要的学习过程。该文的模拟算法中的一个缺点:计算量随局中人的数目和每个局中人类型的数目的增长呈指数增长。

对于多边贸易模式的电力市场,文献[13]提出了多理论模型,解决贸易合作问题,文中的模型基于完全信息的博弈模型。模拟的过程包括四个阶段:①确定自身成本等信息;②与对方互相交换信息,互相寻求合作伙伴;③按照预先设定的准则和协议进行联合分组,形成一个谈判对象优先顺序表,这个顺序表获得方法于[11][12]的方法不一样。作者采用公平性合作标准和Shapely值来确定这个顺序表;④按照优先顺序表进行双边谈判。作者认为这四个阶段可以反复迭代进行,直至没有人愿意改变合作格局为止或者达到预先设定的计算时间。作者在文中考虑了多种情况,但是模型仍偏于简单。

4.5用博弈论解释和实现算法

文献[14]用博弈论来解释拉格朗日松弛法法解决机组经济组合的算法。该文认为在电力市场的环境下,竞争各方均以实现自身利益最大化为目标,旋转备用的约束变得软起来,PX(powerexchange)机构可能通过松弛这一约束进一步降低成本。该文提出了一种基于博弈论的算法获取最优的旋转备用。

作者认为拉格朗日松弛法的拉格朗日乘子是有经济含义的,松弛旋转备用的乘子被看作是提供备用的价格信息,各时段的旋转备用根据这个信息不断在规定的高低两种备用水平之间调整(例如:为t时段负荷)。根据优化原理,如果拉格朗日函数存在鞍点,则鞍点是原问题的最优解。

鞍点的概念与博弈论中的Nash平衡点有非常相似之处,如以上公式所示。基于此想法,作者构造了两厂商博弈模型。其中一局中人P代表整个实际电网的利益,它控制的决策变量是p,u(p向量表示各机组分配的有功,u向量表示机组启停),目标是使整个系统成本最低。另一个局中人Q,是一个假想的发电商,它以价格向P销售备用容量和有功容量。双方就旋转备用交易进行讨价还价,最终达到一个平衡的交易量和交易价格。作者证明以上博弈过程的Nash平衡解就是拉格朗日函数的解。基于以上结论,作者设计了自适应的次梯度算法寻求平衡点,其中一个关键技术作者设计了厂商P对厂商Q备用容量报价的反应函数该函数将映射到备用容量的两种水平之间(例如:5%Dt-%Dt,Dtt时段负荷),形成一个随价格信息变动的备用容量。根据厂商Q是否了解厂商P的反应函数,模型可细分为两种:Nash模型(不了解对方反应函数)和Stackelberg模型(Q了解P的反应函数),作者认为后一种模型掌握的信息较多,因此收敛的速度和优化的效果梢好于前一种模型。

用博弈论来解释并且设计一些算法是一个新鲜而具有挑战性的课题。博弈论本身就是带有优化功能的一门严谨的数学,不过它更具有人的逻辑思维的色彩,融合了一些用别的方法难以表达的信息。

博弈论的方法第6篇

【关键词】合作博弈行为策略股票博弈

一、博弈论相关理论

(一)博弈论

博弈论又称对策论。是这样一种理论:旨在冲突对抗的条件下,使用规范的数学理论和方法求解一个问题的最优策略。以上个世纪九十年代为起始点,博弈论一直作为一种创新性的经济剖析方法,涵盖了包括信息经济学在内的高等学科理论。二战期间,在军事领域方面,博弈论也最早发挥了用武之地。博弈论在诸多领域里的应用中,最成功的要属经济学。

(二)非合作博弈

非合作博弈研究的是,在非合作形式下,所有人的行动都被看成是个人行为,即一个人在总的策略环境下自主决策,主要强调个人自主性,也就是我们所理解的“博弈”一词的字面意思。博弈本身表达了一种较量,一种冲突,所以在很多情况下被误认为只包含了冲突因素,而实际上也包含了非合作元素,即冲突和合作是共存的。另外,根据参与博弈的人员之间是否完全了解彼此的信息,以及博弈进行的先后顺序,可以将其划分为四种类型:完全信息静态博弈、完全信息动态博弈、不完全信息静态博弈,以及不完全信息动态博弈。

1.完全信息静态博弈。

完全信息静态博弈,与其他三种类型相比,结构是最简单的,即便如此,它也同样涉及了很多非合作博弈中提到的概念。著名的“囚徒困境”博弈桥好能说明这类博弈的特征。

2.完全信息动态博弈。

完全信息动态博弈,指参与博弈的双方都能够完全掌握其他局中人选择的支付函数,且这种函数是在特定的战略组合模式下形成的。这种博弈中的后来者可以观察到前面参与者的行动,进而对其所有信息都有所了解。并且这种类型的博弈一般也都会持续一个较长时期。

3.不完全信息静态博弈。

不完全信息静态博弈,指的是至少有一个局中人对其他局中人的特征是不完全了解的,但却知道其他人所属类型出现的概率。虽然每个局中人不能完全掌握其他人的下一步行动和选择,但却是有路可循的,至少可以根据对方的类型预测到对方大体上会选择什么行动。由此可知,在这种博弈形式下,局中人的最终目的还是根据对自己和他人类型的概率分布进行分析预测之后,使自己的利益最大化。

4.不完全信息动态博弈。

这种博弈类型与精炼贝叶斯均衡相适应。在该博弈类型下,局中人可以根据自己所观察到的信息来推断其他参与者的类型,原因在于局中人之间互相并不清楚对方的类型。

(三)合作博弈

合作博弈包括两种情况:一是博弈双方的利益都有所增长;二是双方中一方的利益增长,另一方的利益不受损害。这两种情况都会使整个社会的利益有所增长。合作博弈研究的是收益分配问题。该博弈下采取的方式主要是合作,也可以说是一种妥协。博弈各方想要达成一致顺利合作,必须经过一个讨价还价进行妥协的过程。即合作剩余的分配,既是达成一致的前提条件,也是妥协后的结果。

二、关于股票市场的博弈特点

如今,博弈论对金融经济领域的影响越来越大。对期货期权市场、证券市场以及保险市场的审视也越多地以博弈论的研究范式为标准。博弈论这一研究方法在股票市场上的运用尚不多见,其中部分原因是由于股票市场构成了一个过于庞大的博弈,人数过多使得博弈论的应用受限。但是,股票市场所进行的的确是一场博弈,博弈论中不少的概念和理论都可以在这里得到应用。

(一)对股票市场的分析

现今,从市场有效理论来说,我国股市属于弱市场。而且“政策市”特征也越来越明显。在很大程度上,政策性因素阻碍了股市本身的正常运作,从发展的角度看,也会损害博弈双方参与者的利益。但是,分别从两者各自的利益角度而言,这种政策性操作确实已经成为当前国家和投资者赖以生存的支柱。因此,政策性因素既是我国股市正常运转的条件,也是我国股市处于制度变迁过程中的一个明显特征。

(二)对股票市场的博弈类型分析

根据博弈中参与者的数量多少,可将博弈分为双方博弈和多方博弈。多方博弈即包含两个以上的参与者的博弈,也更为复杂,而股票市场显然属于多方博弈。实际上,股票市场上存在的博弈到底是哪种类型,总结来说有两种不同看法:一种是把股票市场看作是饱和状态,自己的所得(所失)就是别人的所失(所得),即股票市场是一个零和博弈的市场;另一种观点是把股票市场看作是非饱和状态,自己的所得(所失)不等价于别人的所失(所得),即股票市场是一个非零和博弈的市场,这种观点的依据是股市的总价值总是处于不断的变化之中。相应地,也就有两种不同的方法来计算股市博弈的收益。第一种算法仅以钱作为计算标尺,而股票作为一种筹码,没有内在价值。那么股市就类似于一场没有休止符的赌局,原因在于筹码不能兑换。第二种算法下,计算收益时把股票的内在价值考虑在内。这种观点实际上是把股市看作是一个社会资源再分配的场所。若按第一种算法计算,人们会倾向于持币;若按第二种算法,人们会更倾向于持股,因为股票可以升值,而货币却是逐渐贬值的。

三、关于股票市场的博弈策略分析

(一)将对手分化,衍生出独立子博弈

有些博弈即使有多方参与,实际上也是可以分解为很多个由少数人参与的子博弈,并且各个子博弈间是相互独立的。这样参与整体博弈的过程就可以转变为参与一个个独立的子博弈。那么如果市场中的强者能找到一个只有少数人参与的子博弈,则对这个子博弈的解析也就变得相对简单化。即便参与者还是很多,至少也可以大大降低了这个子博弈的复杂性。也可以说是形成了一种分而治之的策略。

(二)联合其他参与者建立共同联盟

在股票市场上,如果有的参与者处于相对弱势的地位,那么这些人必然不愿意单独与强者对抗,也就很自然会想到与其他参与者联合起来共同对抗。所以,这种策略对应的是弱者积极促成对自己有利的联盟形式。但值得一提的是,这种形式的联盟是不由人的主观意志为转移的,每个参与者都是以自身的利益最大化为原则,来决定加入或者不加入某一联盟。由此可知,如果每个参与者都只考虑个人得失,那么联盟本身也就起不到明显的共同对抗的效果。即在这种策略下,组织对己有利的联盟时,不能只考虑个人利益,而应该联系实际(如对手或者同盟的力量强弱),尽量促成对己有利的联盟。

(三)中立策略和跟随策略

有时市场的投资者可以采取保持中立或者跟随的策略参与到多方博弈中来。但保持中立也是有前提的,一方面,既然决定保持中立就必须满足于较少的利益,如果追求利益最大化,就没办法保持中立。因为一场博弈中,自己的所得来自于其他参与者的所失,故而保持中立只能从博弈中获得较少的收益。另一方面,中立只存在于竞争不太激烈的博弈中否则竞争过于激烈,参与者的对抗就会大规模卷入,这种形势下保持中立就很困难。所以,中立者只能在对抗不那么激烈的博弈中才有立足之地。

参考文献

[1]王建华.对策论.北京.清华大学出版社.1986.

[2]刘德铭,黄振高.对策论及其应用.长沙.国防科技大学出版社.1995.

[3]约翰•纳什著.张良桥等译.纳什博弈论文集.北京.首都经济贸易大学出版社.2000.

[4]莱因哈德•泽尔腾著.黄涛译.策略理性模型.北京.首都经济贸易大学出版社.2000.

博弈论的方法第7篇

[关键词] 博弈论与旅游学 价格战 对策

一、博弈论及旅游价格战的博弈模型

1.博弈论与旅游学。博弈论又称为对策论(games theory),是研究具有斗争或竞争性质现象的理论和方法,它既是现代数学的一个新分支,也是运筹学的一个重要学科。它较好地解决了对竞争等问题的可操作性分析,近年来不仅成为经济学中激荡人心的一个研究领域,也为其他许许多多包含竞争现象的问题提供了精细的分析技巧。随着博弈论在各学科中的普遍应用,旅游学中的各分支学科也在不同程度上开始了应用博弈论方法进行分析的探索。

2.旅游公司价格竞争的博弈模型。价格竞争是行业重复建设、对行业总体市场容量过度乐观、企业数量发展过快的结果。近年来,由于国家产业政策的支持, 旅游的产业规模急剧膨胀,旅游公司数量增长幅度大大超过了旅游人数的增长幅度,从而造成供求失衡。旅游公司为争夺市场份额,纷纷把降价作为争夺客源的主要手段。按照博弈论的观点,在非合作博弈条件下,降价是企业的合理选则。现用博弈模型分析如下,假定在旅游市场有两家经营同类产品的旅游公司:a和b,还假设他们同时行动,并只有两种选择:降价和不降价。从而得到表1的旅游价格战博弈模型:

(r——对双方合作的奖励,p——对双方背叛的惩罚,s——给笨蛋的报酬,t——对背叛的诱惑)

运用画线法可求得该博弈的得益数组(420,420)所对应的策略组合(降价,降价)为本次博弈的纳什均衡。由于纳什均衡是一种非合作博弈均衡,虽然双方选择(不降价,不降价)要比降价好,但是参与博弈的双方都是以追求自身利益最大化为目标,每一方都不能保证对方会不降价而自己也采取不降价来共同分享利益,为防止对方降价而自己不降价给自己带来损失的情况发生,最终双方选择的是均采取降价的纳什均衡(420,420)。于是你降我也降,你再降我也再降,重复博弈的结果就是价格大战越来越激烈。这从博弈角度说明了价格竞争的必然性。

实践证明,即使公司能够签订都不降价的行业自律协议,也是无法有效避免降价竞争的发生。因为策略组合(不降价,不降价)不是纳什均衡,行业自律协议不具强制性约束力,即使在短期内能够维持在脆弱的自律平衡状态,机会主义或其他因素也会很快将此不稳定均衡状态破坏掉。这在博弈理论中已有严格的证明。

二、应对旅游恶性价格竞争的对策

在市场经济环境下,自由竞争是市场经济活力的源泉。价格竞争是市场竞争的一种重要方式,特别是在供需失衡的行业中,当供大于求时,价格竞争将更为激烈。然而过度的价格竞争对行业的发展是不利的,以下对如何避免过度价格竞争做一探讨。

1.通过改变博弈模型的结构消除过度竞争。据前所述博弈模型,旅游公司之间的价格战博弈只要符合两个条件:1)t>r>p>s;2)r>(t+s)/2,各公司的最佳选择都是该博弈唯一最优的“纳什均衡”(降价,降价)。要避免出现旅游恶性价格战,可以通过改变博弈结构,使博弈方的收益值不再符合该博弈模型的两个条件。

一种方法是博弈双方主动改变博弈策略,将公司目标从“收入”调整为“利润”。以表1的旅游价格战博弈为基础,根据旅游业的特点,不妨假设选择“不降价”策略时,旅游企业的利润率是30%,选择降价策略时,旅游企业的利润率是20%,则得表2。

以利润为目标的旅游价格战博弈不再符合原博弈模型的两个条件,博弈的最终结果发生了改变,不再是唯一的(降价,降价)。其中纯策略纳什均衡通过划线法容易找到为两个,即(150,150)和(84,84)。目前博弈论界正在研究表2所示的(不降价,不降价)这样的最优纳什均衡出现的条件和机制,一旦找到,就可以为避免恶性的价格竞争提供一条途径。由于其中的研究颇为复杂,此处不再赘述。

另一种改变改变博弈结构的方法是旅游监管部门作为新的当事人参与博弈,也有可能会使旅游公司避免出现恶性价格战。但这需要旅游监管部门加强执法力度,对降价的公司给予足够大的惩罚才能奏效。

2.持续创新同样是旅游行业获得较高利润,避免过度竞争的有效途径。旅游企业可通过开发特色旅游新产品而避免产品雷同。比如近几年的老年旅游市场的开发;以高中学生为对象,在假期举行的高校游;以各种兴趣为对象的摄影游、徒步游、探险游等。

3.除此以外,政府还可通过深化体制改革,硬化企业投资约束,从而消除产业过度进入,达到供求平衡,避免过度竞争。

总之,这些策略需要旅游企业根据市场环境的变化及自身实际情况适时进行创新、调整和选择。

参考文献:

博弈论的方法第8篇

罗伯特•奥曼作为一名杰出的经济学家,在决策制定理性观点方面有着杰出的贡献,对博弈论和其他许多经济理论的形成起到了重要的乃至不可或缺的作用。因此,他于1983年获得了以色列技术机构颁发的科学技术哈维奖,1994年获得了以色列颁发的经济学奖。本文就他在博弈论方面的贡献以及相关思想作一评析。

一、弈论:交互式条件下“最优理性决策”

一般认为,博弈理论始于1944年。数学家约翰•冯•诺伊曼(john von neumann)和经济学家奥斯卡•摩根斯坦(oskar morgenstern)合作出版了《博弈论与经济行为》一书,概括了经济主体的典型行为特征,提出了策略型与广义型(扩展型)等基本的博弈模型、解的概念和分析方法,奠定了经济博弈论大厦的基石,也标志着经济博弈论的创立。

那么,什么是博弈论?奥曼认为,较具描述性的名称应是“交互的决策论”。可以看到,奥曼对博弈论的定义是十分简洁凝练的。因为博弈论是研究决策者的行为发生直接相互作用时的决策以及这种决策的均衡问题的,就是说人们之间的决策与行为将形成互为影响的关系,一个经济主体在决策时必须考虑到对方的反应,所以用“交互的决策”来描述博弈论是再简洁不过的了。奥曼还以经济主体的理性为分析的出发点,认为博弈论是交互式条件下“最优理性决策”,即每个参与者都希望能以其偏好获得最大的满足。如果仅有一个参与者,通常就会产生划分明确的最优化问题。而在多人参与者的博弈论中,一个参与者对结果的偏好等级并不意味着是他的可能决策的等级,这个结果也取决于其他参与者的决策。

奥曼还分析了一般和特殊模型中的“解概念”,指出,就社会科学的理性方面而言,博弈论是一种概括或“统一场论”。这里的“社会”是广义的,包括人类和非人类的参与者(如计算机、动物、植物等)。与探讨像经济学或政治学等学科的他种方法不同,博弈论不利用个别的、特定的结构讨论各种具体问题,如完全竞争、垄断、寡头垄断、国际贸易、征税、表决、威慑等等。更确切地说,博弈论发展了原则上应用于所有交互情形的一套方法,并进而探讨这些方法在每一具体应用中所导致的结果。从一般博弈论方法得到的结果与用较为特殊的方法得到的结果之间,常常出现密切的联系。然而在其他的情形下,博弈论方法会得出一些其他方法未能得出的新见解。

二、完全竞争经济:参与者连续统模型

众所周知,完全竞争经济模型描述了一种存在着许多参与者(居民和厂商),并且每个参与者的影响都是微不足道的市场情形。就是说,在完全竞争的经济状态下,每个居民或厂商的交易量相对于市场总量来说是很小的,任何一个人交易的商品数量并不会影响总供给和总需求。然而,奥曼认为:“事实上,只要仅存在有限多的参与者,个别参与者对经济的影响就不能被忽视。因此,适合于完全竞争的直观上的概念的数学模型必须包括无限多的参与者。我们认为适合这个目的的最自然的模型包括了参与者连续统(continuum),类似于一条线上点的连续统或流体中粒子的连续统。”

在经济理论中,“连续统”观点的引入对经济学的学科发展有很大的影响。奥曼指出,连续统可以被看作接近于存在许多但是数量有限的粒子(或经济主体,或策略,或可能的价格)的真实情形。采用连续统的粗略估计的目的是使称为“分析”的数学分支的强有力的、精确的方法得以应用,而使用有限的方法将会更困难甚至是无望的。古典经济学假定每个人接受既定的所有商品的价格(单个居民或厂商的决策不能影响价格)。为了使经济处于稳定的状态,价格必须使总需求等于总供给,这就是瓦尔拉斯的竞争均衡(walrasian competitive equilibrium)。奥曼证明了它的存在,并用商人连续统的市场作了明确的说明。

奥曼还考虑了称为联盟的团体和它们之间以互益的方式进行的交易。竞争均衡定义假定厂商允许市场力量决定价格,他们根据市场价格进行交易;而对埃奇沃思著名的“契约曲线”(contract curve)进行概括的博弈论概念的核心,则认为这个核心由在此之上没有联盟可以有所进步的所有分配组成,它忽视了价格机制,仅仅涉及参与者之间的直接交易。奥曼指出,竞争分配的核心和模式与厂商连续统的市场相一致。奥曼通过精确表达完全竞争观点的连续统模型,成功地使最初由埃奇沃思提出,经许多其他模型改进的理论精确化,并从此成为经济理论的基本准则之一。

此外,1975年,奥曼还获得了另一个完全竞争经济中竞争分配和值分配之间等价性的结果。在奥曼看来,博弈论和经济理论中最显著而独有的现象或许是竞争市场经济的价格均衡与对应的博弈的主要解概念(除一个以外)之间的关系。直观上看,等价性原理是说,市场价格的建立是从在完全竞争市场上运转的基本力量自然地产生的,几乎不管我们假定这些力量是怎样运转的。

综上所述可以看到,完全竞争分析所获得的基本观点,使对完全竞争之外的基本经济问题的研究成为可能并且更加容易。在这方面,奥曼最重要的贡献和影响是利用一个或更大的参与者的连续统建立的垄断和寡头垄断竞争模型,以及公共经济学基于经济活动和政治过程相互交织的税收模型,如表决、固定价格模型等。

三、重复博弈论:理论系统性的发展

重复博弈是指同样结构的博弈重复多次,其中的每次博弈称为“阶段博弈”。重复博弈是动态博弈中的重要内容,它可以是完全信息的重复博弈,也可以是不完全信息的重复博弈。奥曼对重复博弈的贡献在于对理论系统性的发展起了一定的促进作用。

首先是对完全信息的重复博弈研究的促进。完全信息博弈的最早结果出现在50年代,被称为“佚名定理”。该定理认为,重复博弈的策略均衡结局与一次性博弈中的可行的个体理性结局恰好相一致。这个结局可被视为把多阶段非合作行为与一次性博弈的合作行为联系在一起。然而,虽然所有可行的个体理性结局确实代表了合作博弈的解观点,但是它相当模糊,并且不提供信息。而奥曼认为,完全信息的重复博弈论与人们之间相互作用的基本形式的演化相关。它的目的是解释诸如合作、利他主义、报复、威胁(自我破坏或其他)等现象。博弈论和新古典经济学模式的现象,可能一开始看起来是非理性的。

奥曼还考察了许多具体的合作行为,定义了“强均衡”概念,即没有任何参与者团体可以通过单方面改变它们的决策来获益的情形。他指出,重复博弈的“强均衡”与一次性博弈的核(更精确的是“6核心”)相一致。为此,奥曼定义和研究了经济理论中极为重要的“一般”合作博弈,即非转移效用(non-transferable utility)博弈,这开拓了该领域的研究空间,因为在此之前,仅有“单边支付”博弈被研究,即每个联盟可以任意在其成员中分享一定数额的赢得。

其次是对不完全信息的重复博弈研究的促进。从20世纪60年代中期开始,奥曼和其他合作者一起,在其学生的辅助下,发展了不完全信息的重复博弈论。1966年,奥曼和m.马希勒(michael maschler)在给美国武器控制和裁军机构的开创性报告中,建立了不完全信息的重复博弈模型。他们指出,信息使用的复杂性实际上可以以一种出色的、简练的、明确的方式来解决。在最简单的一个重复的2人零(zero-sum)和博弈中,其中一个参与者比另一个拥有更多的信息(这就是所谓的单边的不完全信息),拥有更多信息的参与者所使用(并揭露)的信息数量是被精确地决定的;有时是完全揭露或根本没有揭露;有时是部分揭露。这种分析被扩展至更一般的模型,即2人零和博弈与非零和博弈。许多新的精深的观点和概念由此产生。例如,奥曼、马希勒和斯特恩斯在1968年引入了一个“联合控制的”(jointly controlled lottery)的概念,即没有参与者可以单方面地改变不同结果的可能性,这个概念与非零和博弈密切相关。之后,奥曼在重复博弈上的研究获得了丰硕成果。事实上,他的有关不完全信息博弈的许多重要观点已被应用于许多经济学科,诸如寡头垄断、委托人与人、保险等等。

四、合作与非合作博弈论:非转移效用与理性的假设

博弈论还可以划分为合作博弈与非合作博弈。在20世纪50年代,既是合作博弈发展的鼎盛期,又是非合作博弈的开创期。奥曼在该方面的贡献在于,一方面把“可转移效用”理论扩展为一般的非转移效用理论;另一方面发展并提炼了“什么是理性”,使之形成统一的观点。

合作博弈理论不讨论理性的个人如何达成合作的过程,而是直接讨论合作的结果与利益的分配。合作博弈的基本形式是联盟型博弈,它隐含的假设是存在一个在参与者之间可以自由转移的交换媒介(“货币”),每个参与者的效用在其中是线性的。

这些博弈被称为“单边支付”博弈,或“可转移效用”博弈(tu-games)。奥曼把“可转移效用”理论扩展到一般的非转移效用理论,发展并加强了可转移效用和非转移效用的合作博弈论。他先是界定了非转移效用联盟形式的博弈概念,然后提出了相应的合作解的概念。他研究了不同模型中的合作解,同时,将非转移效用值公理化,这是奥曼对合作博弈论基本原理所作的贡献之一。在1985年,奥曼还成功地制定了描述非转移效用值的一个简单公理集,这不仅拓展了这一领域的研究,而且产生了许多新的研究方向。

非合作博弈论的重点是对个体的战略选择,即每个参与者如何博弈,或者说选择什么策略达到他的目标。与之不同,合作博弈理论的重点则是对群体,并仅从更一般的意义上阐述了每个联盟的赢得,而没有说明如何赢得。奥曼通过多年的努力,发展并提炼了“什么是理性”。他认为:“如果一个参与者在既定的信息下最大化其效用,他就是理性的。”因此,一个理性人选择他最偏好的行动,当然“最”是相对于他所掌握的(关于环境和其他参与者的)知识而言的。令人惊讶的是,这个看上去简单清晰的表述可以以不同的方式理解,当然,也有些是互相矛盾的。什么是“参与者的信息”?他知道其他人的什么情况?是他们的理性吗?奥曼在他的许多影响深远的研究工作中解决了这些问题,并为这些模型制订了标准。

首先,他考察了知识和信息问题。对于这个问题,奥曼相当精确地概括出具有常识性的概念。他指出,如果开始时两个参与者具有了相同信念,但在对于一个具体事件的较晚的信念(基于不同的个人信息)是常识的,则这些较晚的信念必然形成一致。奥曼的观点对非博弈论产生了重大的影响。一方面,它导致了涉及多人情形下知识的正式概念的“交互认识论”整个领域的发展。另一方面,它形成了许多应用范畴。从经济模型——诸如只要人们有相同的最高执行官,他们的行为是人所共知的,那么具有不同信息的人们之间就不会产生交易——到计算机科学——用于分析分布环境,诸如多重处理器网络等。

其次,他假定参与者是“贝叶斯理性的”(bayesian rational)。这在一人决策论中或许是标准的,但是它在多人模型中是否也适用?奥曼引入了相关均衡的基本理论概念。相关均衡出现在经济和其他许多领域,引起了对不同交流程序和通常所说的“机制”的更重要的研究。

同时,奥曼还研究了“达到古典纳什均衡所需要的理性和理性知识的范围”的基本问题。他的观点与专业人士相反,认为答案并不一定是“理性的常识”。严格的理性是对决策者行为复杂的假设,由此产生了对边界理性模型的考察,该模型放宽了假定。奥曼指出,在交互情形下,微小的非理性是如何起很大作用的。实际上,在某些情形下,它能够导致重复博弈的合作。

五、其他贡献

奥曼在值集函数(即值为点集而非单独一点的函数)领域,也作出了许多重要的贡献,如“奥曼可衡量选择定理”、值集函数积分结果等。大部分问题产生于对不同博弈论和经济模型的研究,经济人连续统和数学理论是这些模型演化和分析的重要工具。奥曼所获得的诸如一般均衡、最优分配、非线性编制程序、控制理论、测量理论、定点理论等结果是基本的,它们被应用于经济学、数学、运筹学等许多领域。此外,奥曼把库恩(kuhn)著名的完全检索有限博弈中的行为和混合战略的均衡结果扩展为无限的情形,克服了复杂的技术困难。除了他发表的书外,奥曼多年来对许多人的研究产生了直接的影响。他向他们建议并提出了重要的问题和研究的渠道,与他们分享了深层的理解,帮助并鼓励他们从事研究工作。奥曼总是引导他的学生走向这一领域,与学生之间形成了双向反馈的相互作用,所获得的结果又被他用于塑造和提炼他的观点和理解。

六、简评

在过去的几十年中,奥曼对博弈论和经济理论的发展作出了重要贡献。可以说,在当代的博弈论研究中几乎没有他未涉足过的领域。他的研究具有与众不同的广度和深度,他的科学贡献从基本概念、学科的发现与形成到适当工具与方法的发展在分析不同具体问题中的应用,都具有开创性的进展。值得注意的是,奥曼的大部分研究与经济理论的中心问题联系密切。一方面,这些问题为他的工作提供了刺激和推动力;另一方面,他研究的结果产生了经济学新的见解和思维。

同时,奥曼的哲学论文和研究也具有相当的影响力。事实上,奥曼成功地以许多不同的受众可以接受的方式解释了甚至是最复杂的观点。他的研究并不止是一张简单列表,而是展示了所有美丽和清晰的宏伟画面,指出了成就、需要解决的困难以及将来研究的领域。毫无疑问,奥曼的观点从总体上说,在建立并使博弈思想和经济理论思想的轮廓更加清晰方面起了重要的作用。

【参考文献】

1.aumann,r.j.,1964,markets with a continuum of traders,econometrica 32.

2.aumann,r.j.and shapley,l.s.,1974,values of non-atomic games,princeton:princeton university press.

3.aumann,r.j.,1976,agreeing to disagree,annals of statistics 4.

4.aumann,r.j.,1985,an axiomatization of the nontransferable utility value,econometrica 53.

5.aumann,r.j.,1985,notes and comments on the nontransferable utility value:a comment on the roth-shafer examples,econometrica 53.

6.aumann,r.j.,1987,value,symmetry,and equal treatment:a comment on scafuri and yannelis,econometrica 55.