演化博弈理论

简述

在传统博弈理论中，常常假定参与人是完全理性的，且参与人在完全信息条件下执行的，但在现实的经济生活中的参与人来讲，参与人的完全理性与完全信息的条件是很难达到的。在企业的合作竞争中，参与人之间是有差别的，经济环境与博弈困难自身的复杂性所致使的信息不完全和参与人的有限理性困难是显而易见的。

传统博弈理论区别

与传统博弈理论不同，演化博弈理论并没有要求参与人是完全理性的，也不要求完全信息的条件。有限理性这一概念最早是由西蒙(Simon.H.A.)在研究决策困难时提出的，它是指人的举动只能是“意欲合理，但只能有限高达”。威廉姆森在研究影响交易费用的原因时，对有限理性的困难执行了归纳归纳人的有限理性是由两方面的原因引起的：一面是受于人的感知认识能力制约，它包含个人在获取、储存、追溯和运用信息的过程中不或许做到精准无误；人的有限理性的另一面则是来自语言上的制约，由于个人在以别人能够理解的方式通过语句、数字或图表来表达自己的知识或感情时是有制约的(这恐怕是由于他们没有掌握到所必需的词汇，恐怕是由于这些词汇还不存在)，不管多么付出，民众全会发现，语言上的制约会让他们在行动中感觉到挫折。从这两个方面来说，完全理性的人根本就不或许存在。

演化博弈论是把博弈理论分析和动态演化过程分析结合起来的一种理论。在方法论上，它不同于博弈论将着重放在静态均衡和比较静态均衡上，强调的是一种动态的均衡。演化博弈理论因为生物进化论，它曾相当成功地解释了生物进化过程中的某些现象。如今，经济专家们运用演化博弈论分析社会习惯、规范、制度或体制形成的影响要素以及解释其形成过程，也获得了让人注目的成绩。演化博弈论当前形成演化经济学的一个重要分析手段，并渐渐发展成一个经济学的新领域。

根源

经济演化思想很早就存在于经济理论中，即便是在以静态分析为主的新古典经济学盛行的年代，演化思想也依然在经济学中占有一席之地。马歇尔(Marshall，1948)就曾表示，演化的概念比静态的概念更复杂，所以大批的经济基础理论研究依旧以机械类比、均衡、平稳、决定性为主；阿尔钦(Alchian，1950)建议在经济分析中用自然选择的概念代替利润最大化的概念，觉得适度的竞争可以作为决定各种制度形式存在的动态选择机制。在该种选择机制下，即便不把举动主体看作是理性的，但来自社会的演化阻力(优胜劣汰)也将促使每个举动主体采取最适合本身生存的行动，进而致使高达的演化均衡为纳什均衡。阿尔钦的该种演化观不仅为新制度经济学研究制度的选择给予了一个思路，而且也为演化博弈论的成长给予了思路；纳什(Nash，1950)的“群体举动解释”，则觉得是包含较完整的演化博弈思想的最早理论成果。纳什觉得，不需要如果参与者相关于总的博弈结构的充分知识，也不要求参与者有执行任何复杂推理的愿望和能力，只需假定参与者能够积攒有关各种纯策略被采取时的相对优势的实证信息，纳什均衡仍可高达。

发展

演化博弈理论能够在各个不同的领域得到极大的成长应归功于斯密斯(Smith，1973)与普瑞斯(Price，1974)，他们提出了演化博弈理论中的基本概念——演化平稳策略(Evolutionary Stable Strategy)。斯密斯和普瑞斯的工作把民众的注意力从博弈论的理性陷阱中摆脱出来，从其他角度为博弈理论的研究寻求到或许的击穿口。由此以后，演化博弈论快速发展起来。20世纪80年代，伴随对演化博弈论研究的深入，很多经济专家把演化博弈理论引入到经济学领域，用于分析社会制度变迁、产业演化以及股票市场等等，同期对演化博弈理论的研究也开始由对称博弈向非对称博弈深入，并获得了适当的成果。20世纪90年代以来，演化博弈理论的成长进入了一个新的阶段。威布尔(W.Weibull，1995)比较系统、完整地归纳了演化博弈理论，其中包含了一部分最新的理论研究成果。其余的一部分理论成果包含克瑞斯曼(Cressman，1992)以及萨缪尔森(Samuelson，1997)的著作。

应用研究

就在此时，演化博弈论在经济学中的应用研究也飞速发展。弗里德曼(Friedman，1991)觉得演化博弈在经济领域有着极大的应用前景，并对一部分具体应用前景的动态系统执行了探讨；巴苏(Basu，1995)研究了公民规范和演化之间的关系，觉得规范的长期存活依靠于演化过程和自然选择；弗里德曼和方(Friedman＆ Fung，1996)以日本和美国的企业组织模式为背景，用演化博弈分析了在无贸易和有贸易情形下企业组织模式的演化；拜斯特和古斯(Bester＆Guth，1998)用演化博弈理论研究人类在经济活动中利他举动的存在性及其演化平稳性。登弗伯格和古斯(Dufwenberg＆Guth，1999)在双寡头垄断竞争的情形下比较了两种解释经济制度的方法：间接演化方法和策略代理方法，研究了在怎样的市场环境中这两种方法会致使类似的市场结果；戈特曼(Guttman，2000)用演化博弈理论研究了互惠主义在有机会主义存在的群体中能否能够存活的困难；青木昌彦(2001)从认知的角度提出了一个有关进化博弈的主观博弈模型；哈如威和普拉赛德(Haruvy＆ Prasad，2001)运用演化博弈的方法研究在具有网络外部性的条件下免费软件的最优价格和质量；科斯菲尔德(Kosfeld，2002)建立了德国超市购物时间失常的演化博弈模型；奈宝格和瑞戈(Nyborg＆Rege，2003)用演化博弈理论研究了顾及别人感受的吸烟举动的社会规范的形成；加斯米那和约翰(Jasmina＆John，2004)研究了三种不同的学习规则在公共物品博弈中仿制人类举动时谁表现得更好的困难；丹尼尔、阿瑟和托德(Daniel，Arce＆ Todd，2005)研究了四种不同类型的囚徒窘境博弈，表示这四种囚徒窘境要促成合作所需的演化和信息要求。

发展方向

进入2l世纪以来，国内的学者也开始关注演化博弈论。谢识予(2001)、张良桥(2001)、盛昭瀚和蒋德鹏(2002)介绍了演化博弈理论的一部分基本概念和有关内容；崔浩、陈晓剑和张道武(2004 )用演化博弈论的方法分析了有限理性的利益有关者在共同治理结构下参与企业所有权配置并高达纳什均衡的演化博弈过程；胡支军和黄登仕(2004 )给出证券组合选择的一个演化博弈方法；高洁和盛昭瀚(2004)研究了发电侧电力市场竞价的演化平稳策略；周峰和徐翔(2005)运用演化博弈论探讨了农村税费改革困难；刘振彪和陈晓红(2005)创建了从单阶段创新投资决策到多阶段创新投资决策的演化博弈均衡模型研究企业家创新投资决策困难；石岿然和肖条军(2004)在一个三阶段Hotelling博弈模型的基础上研究双寡头零售市场价格策略的演化平稳性困难；易余胤等(2003；2004；2005)运用演化博弈方法研究了信贷市场、双寡头市场、自主创新举动、合作研发中的可能主义举动等一连串困难。从以上的研究成果来说，近一两年来有逐渐增多国内学者关注该领域，而且应用演化博弈论探讨了经济学领域中的很多困难。但国内的研究成果依然存在着不少困难，首要体当下：(1)对演化博弈论的特质以及基本概念不够清晰，演化博弈并没有是演化的看法和博弈的思想简单相加，动态演化的博弈模型也不一定就是演化博弈模型；(2)运用演化博弈论解释某些困难显得“牵强附会”，让人感觉导致单纯套用演化博弈论，或是不清楚演化博弈论的理论框架；(3)只能运用一部分非常简单的演化博弈模型，研究不够深入。实际上，困难(2)、(3)的造成起码部分是受于(1)引起的，所以，有必要把演化博弈论(模型)的特质以及基本概念界定清楚。

特质

一般的演化博弈理论具有如下特质：它的研究对象是伴随时间改变的某一群体，理论探索的目的是为了理解群体演化的动态过程，并解释表明为何群体将高达当前的这一状态以及如何高达。影响群体改变的原因既具有适当的随机性和扰动现象(突变)，又有通过演化过程中的选择机制而呈现出来的规律性。多部分演化博弈理论的预期或解释能力在于群体的选择过程，一般群体的选择过程具有适当的惯性，同期这个过程也潜伏着突变的活力，进而持续地造成新变种或新特质。

差不多所有的演化博弈理论都具有上述特质。但是，演化博弈论在经济学领域的应用与运用演化博弈理论解释生物进化现象有所不同，演化博弈论中的一部分生物进化的概念在经济学领域中无法应用。比如，性别和交配，染色体和代际等等，这些概念很难被引入到经济学领域中来。演化博弈论在经济学领域的应用首要是考虑微观个体在演化的过程中可以学习和模仿其余个体的举动，即沿用拉马克的遗传基因理论。

一般的演化博弈模型的建立首要基于两个方面：选择(Selection)和突变(Mutation)。选择是指能够得到较高支付的策略在以后将被许多的参与者采取；突变是指部分个体以随机的方式选择不同于群体的策略(或许是能够得到高支付的策略，也或许是得到较低支付的策略)。突变其实也是一种选择，但只有好的策略才可生存下来。突变是一种持续试错的过程，也是一种学习与模仿的过程，这个过程是适应性且是持续改进的。不具备这两个方面的模型不能称为演化博弈模型。比如，艾格则等(Agiza，Hegazi&Elsadany，2001)提出了一个动态演化的博弈模型，它在有限理性的企业都采取适当的举动规则(产能调整机制)下研究企业重复博弈能否可以高达纳什均衡。这个模型尽管研究的是有限理性个体和动态演化过程，但不属于演化博弈模型，由于没有包含选择和突变的过程。假使把这个模型作如向下修正改，便可以看作演化博弈模型：如果企业有很多不同的举动规则，而采取某些举动规则的企业比那些不采取这些举动规则的企业获益更大；伴随时间的推动，采取这些举动规则的企业生存下来，而不采取这些举动规则的企业被淘汰。如此修改后的模型既有选择过程又有突变过程，便形成一个演化博弈模型。

总之，演化博弈模型有如下几个特质：第一，以参与人群体为研究对象，分析动态的演化过程，解释群体为何高达以及如何高达当前的这一状态；第二，群体的演化既有选择过程也有突变过程；第三，经群体选择下来的举动具有适当的惯性。

应用优势

(一)方法论

新古典经济学以原子论和机械力学为理论基础，它假定参与人是完全理性和统一偏好的。参与人在既定的条件下可以得到一个最优方案，比如生产商在技术和资源适当的情形下可以寻到一个得到最大收益的生产方案，消费者在既定的预算条件下可以得到一个最大效用的消费方案等等。博弈论在新古典经济学的基础上增长了举动主体之间的互动，致使理论更贴近现实，但总体来看，博弈论依然没有跳出新古典经济学的框架。所以，在运用博弈论建立模型时，对各种关系作出的如果往往不切合事实，所以，依据此类模型作出的决策往往和现实相差较远，容易致使失误。

演化博弈论摒弃了完全理性的如果，以达尔文生物进化论和拉马克的遗传基因理论为思想基础，从系统论出发，把群体举动的调整过程看作为一个动态系统，在其中每个个体的举动及其与群体之间的关系得到了单独的刻画，可以把从个人举动到群体举动的形成机制以及其中涉及到的各种原因都纳入到演化博弈模型中去，组成一个具微观基础的宏观模型，所以能够更真实地反应举动主体的多样性和复杂性，而且可以为宏观调控群体举动供应理论根据。所以，演化博弈论供应的经济现象的解释比博弈论更深刻、更贴近事实、更有说服力。

(二)认识论

博弈论如果举动主体具有完美的理性思维，即举动主体始终以本身最大利益为目标，具有各种环境中追求本身利益最大化的分析和决策能力，具有在存在交互作用的博弈环境中完美的分析和预期能力，不会犯错、不会冲动、没有不理智。此外，博弈论中的一个最重要的如果就是博弈双方举动人的“共同知识”如果，即所有参与人均为理性的，所有参与人知道所有参与人均为理性的，这样类推，以至无限。这是一个让人很难想象的无限推理过程，就举动人对现实世界的认识能力来说，是一条非常严格的如果。很显然，现实世界该种如果一般是得不足保证的。

演化博弈论对于举动主体采取的是有限理性如果，所以，这些个体不具备博弈论中举动主体的“全知全能”，无法在经济活动中瞬间能够得到最优的结果。在演化博弈论中，举动主体被如果为程序化地采取某一既定举动，它对于经济规律或某种成功的举动规则、举动策略的认识是在演化的过程中得到持续的修正和改进的，成功的策略被模仿，从而造成出一部分一般的“规则”和“制度”作为举动主体的行动标准。在这些一般的规则下，举动主体得到“满意”的收益。这与现实情形更吻合合。

(三)时间的不可逆性

博弈论注重均衡状态的研究，忽略高达均衡的过程。在博弈论中，举动主体能够立刻对外部环境做出完美分析，高达均衡状态。博弈论忽略时问困难，强调举动主体瞬问的均衡，即便考虑时间困难，也把时间看作对称或可逆的。

在演化博弈论中，时间占有非常重要的地位。举动主体在演化过程中持续修正和改进自己的举动，模仿成功的策略等等，都需要一个相对较长的时间。演化博弈论觉得，时间是不可逆的，以往时期内的状态与将来时间的状态是不对称的，因此，举动主体状态的演化跟初始的时间状态息息有关。

(四)随机(突变)原因

在博弈论模型中，不确定原因以随机变量的形式显现，通过给定随机变量的分布，模型的研究将最终集中于一部分重要变量的平均值上，而不确定原因往往被忽视。所以，在博弈论中，即便存在未知性原因，理性的举动人仍可达到最优化的结果。在演化博弈模型中，随机(突变)原因起着核心的作用，演化过程常被看成是一种试错的过程。举动人会试图各种不同的举动策略，而且每一次全会发生部分替代。在多数情形下，用几率分布来描述该种未知性是不或许的，该种不确定使长期最优化决策很难达到，演化过程的长期趋势很难预期，但假使选择过程的适应性标精准定，演化过程呈现适当的规律性，此时，演化过程的长期趋势又是可预期的。

(五)选择机制及均衡

传统的博弈理论中的举动主体是完全理性的，一般，在完全理性的如果下，假使纳什均衡存在，那么博弈双方博弈一次就可直接高达纳什均衡。这个结果不依靠于市场的初始状态，所以不需要任何的动态调整过程。而演化博弈论觉得，纳什均衡的高达应该是在多次博弈后才可高达的，需要有一个动态的调整过程，均衡的高达依靠于初始状态，是路径依靠的。

此外，在有多个纳什均衡的情形下，若某个纳什均衡一定会被采取时，务必存在有某种能够致使每个博弈方都预期到的某个均衡显现的机制。但是，博弈论中的纳什均衡概念自身却不具有该种机制。所以，当博弈存在多个纳什均衡时，即便如果博弈方均为完全理性的，也无法预期博弈的结果是什么，假使博弈方只有有限理性，就更难预期博弈的结果了。诚然，在博弈论中，当存在多个纳什均衡时，可以利用后向归纳法来达到对纳什均衡的精炼，但该种方法的前提条件是参与人需要满足一个比完全理性更强的理性假定——序贯理性。这在现实中是无法高达的。而在演化博弈理论中，均衡的精炼通过前向归纳法来达到，即参与人依据博弈的历史来选择其将来的举动策略，是一个动态的选择及调整过程。所以，即使参与人均为有限理性的，但动态的选择机制将致使在有多个纳什均衡存在的情形下高达其中的某一个纳什均衡，达到纳什均衡的精练。

最常见的选择机制动态方程有三类：第一类为正支付动态方程，在这类动态方程中，所有得到的支付大于群体的平均支付的纯策略都有正上涨率，所有得到的支付差于群体的平均支付的纯策略都有负上涨率；第二类为单调动态方程，在这类动态方程中，若一个纯策略或混合策略得到的支付大于其他纯策略所得到的支付，则前者的上涨率大于后者；第三类为弱正支付动态方程，在这类动态方程中，起码有某些得到支付比群体的平均支付高的纯策略(若存在)有正的上涨率。显然，弱正支付动态方程包含了正支付动态方程和单调动态方程。

在演化博弈理论中运用最为大量的选择机制动态方程是泰勒和朱克(Taylor&Jonker，1978)提出的复制者动态方程，当时他们仅仅研究了对称两人博弈。随后，泰勒(Taylor，1979)把对称情形推广到不对称情形。在复制者动态方程中，纯策略的上涨率与相对支付或适应度(纯策略所得到的支付与群体的平均支付之差)成正比。显然，复制者动态方程包含在前三类选择机制动态方程中。复制者动态方程在经济领域的应用最为普遍，学者们运用复制者动态方程对社会习俗、制度、举动规范等一连串社会经济困难执行了成功的研究。

那么，怎样把演化博弈论的基本概念——演化平稳策略与选择机制动态方程联系起来呢?能否通过选择机制所得到的均衡的精练就是演化平稳策略?从直观看来，演化平稳策略疑似可以保证均衡是平稳的。但正式的平稳性的定义针对的是动态系统，并非是博弈的支付或适应度函数，而且演化平稳策略只能描述系统的局部动态性质，它不能够表现均衡与动态的选择过程之间的关系。所以，演化平稳策略与选择机制动态方程所高达的动态均衡并没有一定是同一个概念。所以，为了更好地描述动态的演化过程，把演化博弈理论中的静态概念与动态过程统一起来，荷什勒佛(Hirshleifer，1982)提出了演化均衡的概念。依照荷什勒佛的概念，若从致使动态系统的某平衡点的任意小邻域内出发的轨线最终都演化趋向于该平衡点，则称该平衡点是局部渐近平稳的，如此的动态平稳平衡点就是演化均衡(Evolutionary Equilibrium)。

众所周知，演化平稳策略是纳什均衡的精炼。那么，演化均衡与演化平稳策略、纳什均衡之间的关系是怎样的呢?弗里德曼(Friedman，1998)表示：

(1)每一个纳什均衡均为动态系统的平衡点；(2)演化均衡一定是纳什均衡；(3)演化平稳策略不一定是演化均衡。

复制者动态方程可以保证演化平稳策略为演化均衡，但在一般的动态方程中演化平稳策略却既不是演化均衡的充分条件也不是演化均衡的必要条件。弗里德曼还觉得，演化博弈论中最为有用、运用最为大量的均衡概念并没有是演化平稳策略，而是演化均衡。由于举动依照某种动态随时间改变的如果是合乎情理的。 ^[1]

评述

演化博弈论摒弃了完全理性的如果以达尔文生物进化论和拉马克的遗传基因理论为思想基础，从系统论出发，把群体举动的调整过程看作为一个动态系统，在其中每个个体的举动及其与群体之间的关系得到了单独的刻画，可以把从个人举动到群体举动的形成机制以及其中涉及到的各种原因都纳入到演化博弈模型中去，组成一个具微观基础的宏观模型，所以能够更真实地反应举动主体的多样性和复杂性，而且可以为宏观调控群体举动供应理论根据。

在演化博弈论中，举动主体被如果为程序化地采取某一既定举动，它对于经济规律或某种成功的举动规则、举动策略的认识是在演化的过程中得到持续的修正和改进的，成功的策略被模仿，从而造成出一部分一般的“规则”和“制度”作为举动主体的行动标准。在这些一般的规则下，举动主体得到“满意”的收益。

举动主体在演化过程中持续修正和改进自己的举动，模成功的策略等等，都需要一个相对较长的时间。演化博弈论觉得，时间是不可逆的，以往时期内的状态与将来时间的状态是不对称的，因此，举动主体状态的演化跟初始的时间状态息息有关。在演化博弈模型中，随机(突变)原因起着核心的作用，演化过程常被看成是一种试错的过程。举动人会试图各种不同的举动策略，而且每一次全会发生部分替代。

近年来，演化博弈论的理论研究以及演化博弈论在经济学的应用研究，形成国外学术界最火热的研究领域之一。演化博牟论依旧经济学特别是博弈论中的一个新领域，可以预见，在将来相长的期间内，演化博弃沧继续会是经济研究中最具发展潜力的前沿领域之一。

推荐文章

热门文章

推荐文章

热门文章