简述
指种群的多部分成员所采取某种策略,该种策略的好处为其余策略所差于。动物个体之间常常为各种资源(包含食物、栖息地、配偶等)竞争或合作,但竞争或合作不是杂乱无章的,而是按一定举动方式(即策略)执行的。
简介
对某个体来说,最好的策略取决于大部分成员在做什么。受于种群的其余部分也是由个体构成,它们都力图最大限度地、许多更有效地繁殖自己的后代,因此能够连续存在的必然是如此一种策略:它一旦形成,任何举止异常个体的策略都不能与之比拟。在环境的每次大变动之后,种群内或许显现一个暂时的不平稳期,但是一种ESS一旦确立,就会平稳下来,偏离ESS的举动就会被自然选择所淘汰。ESS理论可以解释很多常见的生物现象,雄粪(Scatophagastercoraria)在牛粪上等候雌蝇并与之交配的最适时间,依靠于其它雄蝇的等候时间,假使某一雄蝇总是花固定时间等候,其它雄蝇就会获得竞争的胜利。由于固定等候时间若较短,等候时间较长的雄蝇会得到和晚到的雌蝇交配的可能;若固定等候时间较长,那么提早离开的雄蝇便可到另一堆新鲜的牛粪上与到来的雌蝇交配。所以,雄蝇在配偶的竞争中采取的ESS是随机地选择等候时间。再比如狮子不追捕狮子而追捕羚羊,由于这是ESS,否则遭到反击的风险太大;同样羚羊见到狮子就逃跑,而见到别的羚羊不躲避,这是羚羊的ESS。一群相互从未见过的母鸡放在一起,一般会致使相互的打斗,一段时间以后打斗日趋降低,最后形成平稳的单线式社会等级,产蛋量增长,这给群体导致好处;对比之下,群体成员持续更换会导致愈加频繁的打斗,群体产蛋量就会减弱。所以,形成平稳的社会等级,降低群内竞争,是群体中所有成员应接纳的ESS。但是或许会由于战争的日渐增多而致使不平稳理论造成
进化博弈理论来自于达尔文的生物进化论,起码自雷威丁(Lewontin,1960)用于解释生态现象就已经造成了。但直到1973年梅纳德·史密斯和普莱斯(MaynardSmithandPrice)、梅纳德·史密斯(1974)提出了该理论的基本均衡概念——进化平稳策略及泰勒和乔克(TaylorandJoker)提出该理论的基本动态概念——模拟者动态以后,进化博弈理论得到了理论界的广泛关注。尤其是1992年有关进化博弈理论发展的国际学术会议在康奈尔大学的召开,正式确定了进化博弈理论在经济学上的学术地位,此后,该理论在经济学便上得到了快速的成长及大量的应用。逐渐增多的经济专家运用进化博弈理论来分析诸如社会制度变迁;阿克赛尔罗德(1984)、行业发展趋势(波特,1980)、股市发展方向;利奈尔和罗尔、消费者对品牌的选择、社会学习过程及社会习俗形成等领域的有关困难。进化平稳策略是进化博弈理论最基本的均衡概念,它具有大量的应用并在发展中得到了持续完善。 编辑本段进化平稳策略定义及其缺陷背景
在梅纳德·史密斯和普莱斯(1973)、梅纳德·史密斯(1974)提出进化平稳策略概念以前,进化博弈理论的成长还仅仅处在萌芽阶段。在这一期间生态学家们首要应用纯数学理论如极限环、分岔、奇异吸引子(Rosen,1970)等概念来描述生态演化系统并用于解释生态现象,同期把生物之间的互动举动纳入到进化模型当中(Wynne—Edwards,1962),他们的该种处理困难的方法已经蕴含了进化博弈理论的基本思想。在20世纪7O年代,生态学理论和博弈理论在各自领域中都得到了快速的成长,同期实验经济学作为一门学科也得到了经济学界的统一认同,这些条件为进化论与博弈论的结合给予了理论和现实基础。生态学家梅纳德·史密斯和普莱斯(1973)在归纳以前理论的基础上,提出进化博弈理论的基本均衡概念——进化平稳策略,该均衡概念的提出致使进化博弈理论的研究有了清晰的方向,为进化博弈理论的更深一步发展奠定了坚实的基础。定义
所谓进化平稳策略也叫演化平稳策略,是指假使占群体绝大部分的个体选择进化平稳策略,那么小的突变者群体就不或许侵入到这个群体。或者说,在自然选择阻力下,突变者要么更改策略而选择进化平稳策略,要么退出系统而在进化过程中消失。下面我们给出梅纳德·史密斯和普莱斯(1973)所定义的进化平稳策略(参见张良桥,2001):x∈A是进化平稳策略,假使y∈A,y≠x,存在一个∈(0,1),不等式u[x,εy+(1−ε)x]>u[y,εx+(1−ε)x]对任意e∈(0,)都成立。其中A是群体中个体博弈时的支付矩阵;y表明突变策略;是一个与突变策略y相关的常数,称之为侵入界限;εy+(1−ε)x表明选择进化平稳策略群体与选择突变策略群体所构成的混合群体。从定义可以看出,当系统处在进化平稳状态时(群体选择进化平稳策略时所处的状态就是进化平稳状态),除非有来自外部强大的打击,否则系统就不会偏离进化平稳状态,即系统会“锁定”于该状态。定义的直观意思就是,当一个系统处在进化平稳均衡的吸引域规模之内时,它就能够抵抗来自外部的小打击。显然,进化平稳策略是一个静态概念,但它却可以描述出系统的局部即吸引域内的动态性质。理论基础
原初进化平稳策略定义为以后的研究者给予了理论基础,但它是建立在很多理想化的假定之上,存在着很多不够完善的地方:第一,梅纳德·史密斯等是在研究生态现象时提出的进化平稳策略概念的,受于动植物的举动完全是由其基因决定的。因此,每个种群体都被程式化为一个纯策略,整个生态环境的所有种群也被看作一个大群体。但是,同一种群的个体受于其性别不同、需要不同、能力不同、基因突变或基因遗传等原因全将影响到它们的举动,把每一个种群为程式化一个纯策略是没有太强说服力的,把一个生态环境中所有种群看作一个大群体也存在不妥之处;第二,从梅纳德·史密斯等提出的进化平稳策略定义可以看出,它仅适应于互不重叠且相互独立的突变原因的影响,其吸引域半径只与单个突变原因相关,也就是说只有等到一个突变原因对群体的影响消失之后,才可显现其他突变原因,现实中显现该种现象是非常偶然的;第三,梅纳德·史密斯等为了技术上处理的方便及更好地利用数学工具和博弈论来描述生态演化过程而假定群体范围无限大,即隐含地假定博弈的支付空间是一个连通、闭集,这个假定不符合现实;第四,从原初的进化平稳策略定义可以看出,它是一个静态概念,只能描述系统(0,)的局部动态性质,没有涉及到动态系统整体的调整过程,而现实中很多系统的均衡依靠于系统的整体动态性质。 生态意义 从生态意义上表达,进化平稳策略把种群之间的互动举动纳入到模型当中,推广了达尔文的优胜劣汰理论,但是与纳什均衡概念对比,进化平稳策略并没有能解释群体如何高达平稳的。它只能回答一旦高达了该种平稳状态,原群体就对突变者群体者具有较强的抵抗力。也就是说,它只能回答当系统处在某一个均衡点的吸引域时,在一定条件下,伴随时间的演化,该系统就会趋于这个均衡点,而当系统有多重均衡或者多个均衡点或者多个吸引域时,原初的定义就显得无能为力了。实际上梅纳德·史密斯和帕克(MaynardSmithandParker,1976)、梅纳德·史密斯(1978,1979)已经认识到原初定义的某些缺陷,梅纳德·史密斯(1982)予以了一定程度的修进并提出了修进的进化平稳策略概念。非对称群体中的进化平稳策略概念
梅纳德·史密斯早在1979年就已经意识到,原初的进化平稳策略在处理多群体非对称博弈时遇到了问题。他发现,在现实中,如生态学、经济学和其余社会科学中的很多策略互动举动或许发生于两个或多个群体的个体之间,个体之间执行的是非对称博弈,单用原初定义不能很好解释现实中的这些现象。如何把静态的单群体进化平稳标准拓展到多群体情形呢?在单群体中,所有的个体都被程式化了一个纯策略(梅纳德·史密斯假定只有纯策略是值得遗传的),个体之间执行的是两两重复匿名博弈;而且在单群体中,范围很少的突变原因对群体所造成的影响是值得忽视的,所以,非严格纳什均衡策略不或许侵入到最优反映的严格纳什均衡策略群体。在多群体中,突变原因或许来自于各个群体,突变策略者的互动举动将对群体举动造成不可忽视的影响。所以,原初的进化平稳标准仅仅限于严格纳什均衡之间的选择就不能运用于解释多群体情形。泽尔腾(Selten,1980)觉得,把均衡概念由单群体拓展到多群体不是一个简单的过渡,而是涉及到系统的动态调整过程及动态平稳性等一连串的改变。哈曼斯顿(Hammerstein,1981)觉得,在非对称博弈中,个体愈加看好于应用平稳策略来选择举动并决定竞争结果,而这些平稳策略与进化平稳策略对比,或许会有更少的“吸引域”。所以,由进化平稳策略定义所得的结论就显得稍微似是而非了,但他没有做出更深一步解释。泽尔腾(Selten,1980))第一次深入地研究了非对称博弈动态平稳性并利用两群体博弈情形证明“在非对称博弈原初进化平稳策略必定是严格纳什均衡”。后来,范代蒙(VanDamme,1987)在更一般的情形下证明了这个命题。我们知道,严格纳什均衡本来就表明出很好的性质,假使一个理论把其首要的注意力集中于研究严格纳什均衡,那么它就没有任何理论价值;更重要的是很多非对称博弈根本就不存在严格纳什均衡,因此也就无法研究动态系统的平稳性;在非对称博弈中,渐近平稳性实质上也蕴含了严格纳什均衡,所以,渐进平稳性在非对称博弈中也不是一个合适概念;进化平稳策略是一个静态概念,尽管能够描述系统的局部动态性质,但在非对称博弈中,原初的进化平稳均衡与动态演化过程极限结果之间的对应关系却不显著(即显现了局部与全局的冲突)。所以,要研究非对称博弈的动态平稳性就务必通过考察系统的动态演化过程来谋求能够适应于对称博弈与非对称博弈的平稳性概念。为了能够更精确地描述非对称博弈,泽尔腾(1983,1988)通过对引入角色制约举动而提出了适应于非对称博弈的FAS概念。他的定义如下:在有角色制约的博弈G中,一个举动策略s=(s,s)称为进化平稳策略,假使:(i)对任意的s'∈S×S,满足f(s,s)≥f(s',s);(ii)假使f(s,s)=f(s',s)那么对任意的s≠s'有(s',s)>f(s',s')。但是,泽尔滕的进化平稳策略概念即使适应于描述两群体非对称博弈的情形,但它只能描述系统的局部动态性质,而且该定义并没有能够表明出均衡概念与动态演化过程极限结果之间的关系。所以,要更好地描述非对称博弈均衡,就务必正确处理好均衡概念与动态演化过程均衡结果之间的关系。于是,弗里德曼(Friedman,1991)考察了非对称博弈的更一般的单调调整过程并得出了四个基本结论:(1)每一个纳什均衡均为动态系统的静止点@;(2)渐近平稳结果必定是纳什均衡;(3)在对称和非对称博弈中,对所有单调调整过程来说ESS不一定是渐近平稳的;(4)对某些单调调整过程来说,正规FAS是渐近平稳的。在此基础上,他得出了“渐近平稳结果必定是纳什均衡”结论。莱瑞·萨缪尔森和张建波(LarrySamuelsonandJianbo,1992)在弗里德曼(1991)的基础上更深一步考察了非对称博弈的累积单调选择动态并得出:在非对称博弈中,单调调整过程能够刨去所有严格劣的纯策略,而且能够保证均衡结果必定是纳什均衡。同期,他们证明了“平稳点必定是纳什均衡”及“渐近平稳结果必定是严格纳什均衡”,从而加深了弗里德曼(1991)的“渐近平稳结果必定是纳什均衡”的结论。Swinkels(1992)觉得,进化平稳标准不对突变策略组合予以适当制约是说然而去的。特别地,在处理某些经济困难时,突变策略或许来自于参与人或者企业的创新、试验等活动,这些突变策略组合自身或许会影响系统的平稳性。所以,考察相对于后进入突变群体最优反映策略组合的平稳性或许会更合理,而且这些平稳性概念很容易由单群体情形推广到多群体N一人非对称博弈。于是他定义了适应于非对称博弈的策略稳健性概念。非对称博弈的策略稳健
性概念定义:称之为相对于均衡进入者的稳健策略(RobustagainstEquilibriumEntrants,REE),假使存在所有的策略组合y≠x及满足:。其中表明突变策略;ε表明选择突变策略者在群体中所占的比例;w=εy+(1−ε)x表明混合群体;β[εy+(1−ε)x]表明突变策略相对于策略X的最优反映策略,他而且证明了稳健策略是进化平稳策略的一个子集。然后,他又把稳健策略概念推广到了N一人非对称博弈的情形而提出了均衡进化平稳概念:定义:称集合是均衡进化平稳的,假使它是相对于下面性质的最小集:X是纳什均衡策略集合ΘE个非空闭子集,存在∈(0,1),假使x∈X,,及,那么。换句话说,均衡进化平稳集是纳什均衡策略集的最小闭集,它能够保证任何小范围的均衡进入突变者不或许致使群体离开进化平稳均衡的吸引域。拓展
梅纳德·史密斯等提出的进化平稳策略概念其他缺陷就是,他们为了在技术上处理的方便而觉得群体范围无限大,这个假定与现实尤其应用于处理经济困难时并没有吻合。为了使理论与现实更靠近,很多博弈论理论家对有限群体的均衡困难执行了深入的研究。沙弗尔(Schafer,1988)第一次放开群体范围无限大的假定,考察了有限范围群体的进化平稳性并提出了有限群体进化平稳策略概念。他证明“在一般情形下,有限群体进化平稳策略并没有是纳什均衡策略”。汉森和萨缪尔森(HansenandSamuelson,1988)分析了经济博弈的演化过程,并把有限群体进化平稳策略称之为“广泛生存策略”。他们觉得,在现实世界竞争中,将来的利润和可供选择的策略具有未知性,这就会障碍企业选择最优化策略,企业务必通过持续的试验、学习过程来谋求有利可图的满意策略(不一定是最优策略)。沙弗尔(1989)应用“广泛生存策略”来研究企业寡头之间的竞争并得出结论:通过经济自然选择过程而得以生存下来的策略是相对的并非是绝对的利润最大化策略。泰尼克(Tanaka,2000)利用模拟者动态,考察了差别产品对称寡头企业竞争的情形并定义了“全局生存策略”。他得出结论的是:在价格与数量竞争的寡头模型中,全局生存策略均为随机平稳的而且在两种情形下它们是等价的。以上所得到的均衡概念差不多是适应于单群体有限个体情形,并没有适应于有限个体多群体博弈。哈佛保尔和西格蒙德(HotbauerandSigmund,l988)证明了“两群体对称博弈中不存在混合策略进化平稳策略”。泽尔腾(1988)在考察了大批的两人对称博弈的基础上也得出了相似的结论。克瑞斯曼(1992)定义了有限两群体非对称博弈的进化平稳策略,1996年对他所定义的概念作了更深一步表明。他觉得,在模拟者动态下,起码一个群体的突变者所得到的平均支付少于选择平稳策略者所得到的支付,才可保证静止点的渐近平稳性。格雷和瓦格(GarayandVarga,2000)觉得,定义有限数目多群体的均衡概念应当满足如下三点:其一是突变者不能侵入他自己的群体;其二是现有群体对来自外部的随机打击具有较强的抵抗力;其三是多群体进化平稳策略定义应当与非对称博弈理论的基本结论统一。众所周知,纯策略模拟者动态的渐近平稳集并没有一定是进化平稳策略。那么,哪一种动态平稳概念等价于进化平稳策略呢?克瑞斯曼(1990)表示,在单群体条件下强平稳性等价于进化平稳策略,那么多群体的进化平稳策略定义也应当满足多群体平稳性概念等价于多群体进化平稳策略。依据这个标准,格雷和瓦格(2000)定义了严格N群体进化平稳策略概念。其定义如下:定义:策略组合称之为N一群体进化平稳策略,假使对每一个,若,Pi≠Pi',存在随机原因影响下进化平稳策略的拓展
梅纳德·史密斯等提出的进化平稳策略概念第三个缺陷是要求突变原因是不接连且不重叠的。原初进化平稳策略定义受于仅仅考虑单个原因对系统的影响,所以任何偏离均衡状态的举动全将伴随时间的演化自动回复到以前的进化平稳状态。帕克和菲尔德曼(PeckandFeldman,1988)觉得,受于群体范围和后代数目很大,因此随机原因对动态系统的影响是值得忽视不计的。现实并没有是如此,经济演化系统常常会承受来自突变和其余偶然事件的打击,这些原因或许将对系统造成不可忽视的影响。福斯特和杨(FosterandYoung,1990)觉得,首先,进化平稳策略概念把影响系统的原因都看成是一个个孤立的事件,而在现实中系统常常会承受接连的随机打击。假使假定有一个原因的影响消失以后,再考虑其他原因对系统的影响,那么,系统诚然就不会远离以前的均衡状态;其次,现实中显现上述情形纯属偶然现象,一个只能处理偶然现象的理论是没有任何存在价值。现实中,即使单个随机原因对动态系统的影响较少,但它们却或许对系统造成累积作用而定量地更改系统的平稳性,致使系统离开进化平稳状态,系统何时回复到当初的进化平稳状态,依靠于动态过程的全局结构,而进化平稳策略定义是一个局部概念,所以在考虑随机打击时就不能作为分析系统平稳性的标准;又一次,受于系统的极限举动依靠于初始条件,同期在吸引子集合中只有一部分状态是随机平稳的,且随机平稳状态的选择还依靠于随机过程特定的结构,所以,进化平稳策略和一般意义上的吸引子受于没有充分地顾虑到随机原因对进化系统的影响,在描述随机系统的平稳性时也很不理想。于是,他们第一次把影响系统的随机原因纳入到进化模型当中并提出了一个既不同于传统进化平稳策略也不同于吸引子概念的随机平稳性概念。他们的定义如下:定义:群体向量P'是随机平稳的,假使伴随随机影响delta→0,极限密度对P'的每一个小邻域都赋有正几率;更精确地说,Vε>0,0"type="#_x0000_t75">其中N(P')=|P:|P—P'|<ε。其中fdelta(·)是当t→∞时,P(t)的极限分布,delta表明随机原因对系统所造成的影响。粗略地说,一个状态P是一个随机平稳的,假使在长期中,伴随随机打击原因影响的持续变少,系统差不多一定不会离开P的任意少的邻域。随机平稳的群体向量总是存在的,它有如下性质l伴随及delta→0及t→∞,它是一个最小闭集。接着,他们又提出了更一般的概念——随机平稳集。随机平稳集S是一个满足如下条件的状态集合,即从长期来说,伴随随机打击的持续变少,系统差不多一定处在包含于S的任何一个开邻域中。随机平稳集概念的提出把传统确定性动态模型中的进化平稳策略拓展到随机性动态系统中,而且它是一个比进化平稳策略集更精练的概念,是进化平稳集的子集。随机平稳集已经形成描述随机动态系统的基本均衡概念。进化平稳策略与动态的结合
从进化平稳策略的定义可以看出,它只能描述系统的局部动态性质而与系统的全局动态过程无关,但是,要更精准地描述一个系统的动态性质就务必对仔细考察整个系统的动态调整过程。泰勒和乔克(TaylorandJonker,1978)第一次把传统的进化平稳策略定义用模拟者动态模型表明出来,他们证明在一个多群体的模型中,进化平稳策略是渐近平稳的充分但非必要条件。但他们没有做出更深一步的研究。由于此,吉尔博和马特休(Gilb0aandMatsui,1991)在考察群体行动态调整过程的基础上,提出了“循环平稳集”又一均衡概念。“循环平稳集”直接来因为群体举动的调整过程,其基本思想是“可靠近性”。一个策略分布f称为可以从其他策略分布g靠近是指,假使存在一条从f到g的道路,且在该道路方往上任何一点均为相对于该点的最优反映。“循环平稳集”是指在满足“可靠近性”条件下是封闭的策略分布集合(在该集合中任何两个分布之间均为靠近的)。与一般均衡理论不同,仅当参与人依照均衡策略而做出选择时才有效,循环平稳集并没有要求群体维持该种决策状态。循环平稳集的直观意义是,在一个很短的时间间隔内,只有少部分人离开或者死亡而且由一部分新来的人(新生的孩子)代替,这些新来者从他们的母体那里继承一部分举动模式,而且在现行预期(也就是说他们并没有关心举动模式将来的改变)条件下做出最优的反映,一旦新来者选择了某一行动,他就会一直坚持下去(转换成本的存在是他坚持这个行动的一个重要原因)。马特休(1992)给出了一个“平稳”策略的静态表述,在存在对原群体中各策略的初始分布打击的情形下该策略能够维持该种分布。斯温克斯(1992)在马特休的基础上提出了“群体平稳策略”。相对于均衡的进入者来说,所谓“群体平稳策略”是指假使存在一个突变群体(或者进入者群体,譬如说群体A),其支付好于原群体的支付,那么必定存在此外一个群体(如群体B),在这个包含多部分原群体个体而有一少部分群体A的个体的群体中,群体B将得到好于群体A的支付。这个概念也称为“稳健策略组合”。诚然在某些情形下,“群体平稳策略”或许并没有存在,但不是这个概念自身的缺点,显现该种情形与我们所研究的动态过程自身是分不开的。但是,我们或许会问,事实的举动模式又是怎么样呢?假使这个过程并没有是平稳状态,那么平稳状态又是什么呢?在对这个困难做出回答时,马特休利用了吉尔博和马特休(1991)所提出的集值解的概念,同期他也证明了循环平稳集的存在性。BinmoreandSamue1.son(1993)把参与人的学习过程纳入到了进化模型中并提出了自我加深均衡(Fudenberg,D.,1998)。他们觉得,每个参与人全将通过自己的经验来推断对手或许选择的策略而做出最优反映,这个学习过程或许致使系统在不同自我加深均衡的吸引域之间漂移而不会停留在某一个均衡,受于在非均衡路径上的推断不一定正确,所以自我加深均衡或许不一定是纳什均衡。[1]