首页百科经济理论博弈论文章详细

博弈均衡

外汇网2021-06-19 16:15:23 79

简述

均衡是平衡的意思,在经济学中,均衡意即有关量处在平稳值。在供求关系中,某一商品市场假使在某一价格下,想以此价格买此商品的人均能买到,而想卖的人均能出售,此时我们就说,该商品的供求高达了均衡。

博弈均衡是指使博弈各方达到各自觉得的最大效用,即达到各方对博弈结果的满意,使各方事实得到的效用和满意程度是不同的。在博弈均衡中,所有参与者都不想更改自己的策略的如此一种相对静止的状态。

应用

博弈各方的关系不仅体现一种利益上的竞争,更要体现出各方的合作关系。比如,企业间通过收购、兼并等方法执行资产重组,以达到其双赢战略,正是博弈均衡的现实体现。博弈实质上是由动态的竞争(讨价还价)到相对静态的合作”博弈均衡“的一个变动过程,所以博弈均衡不仅是市场竞争的需要,也是企业发展的内在要求。

思想的演化

著名经济专家马歇尔早就说过,经济学有两大研究路径:一是沿着来因为经典牛顿力学的均衡思想;一是沿着来因为生态学的演化思想。纵观经济学的成长历史可以看出这两种思路一直在此起彼伏地斗争着。1890年马歇尔出版了标志着新古典经济学形成的《经济学原理》[1]一书后,均衡思想占领了统治地位,形成经济专家研究的首要方法。运用数学领域的“不动点定理”证明纳什均衡(Nash1951)[2]的存在性,致使纳什形成第一个用不动点定理于经济学研究的经济专家,他所以得到了1994年的诺贝尔经济学奖;此后,经济专家德布鲁(Debru1954)[3]应用“不动点定理”证明了一般均衡的存在而得到了1983年的诺贝尔经济学奖,他们的工作把均衡思想推向了高潮。物理学的中均衡就是不动,其前提条件就是:物理学中的变量多数是值得控制的,而且一般是与时间无关的。但运用均衡思想来研究在时间上不满足可逆性的社会人举动就显得稍微牵强附会了,为了迎合均衡思想,经济专家给参与人附加如理性、完全信息等不切事实的假定,致使经济学离现实越来越远了,这正是理性框架下很难得到合理结论的一个首要原因。伴随经典博弈理论、生态理论及心理学理论研究的深入发展,尤其是心理学家西蒙把其在心理学领域研究的成果直接应用经济分析并所以得到了诺贝尔经济学奖,极大地激励着经济及社会学家从现实人举动出发来解释经济及社会现象,2002年诺贝尔经济学奖授予给丹尼尔·卡内曼标志着经济学的研究对象从传统的“经济人”转向现实的“社会人”,从现实社会人出发的演化经济学、进化博弈理论等得到了快速发展,从均衡思想的演化来说,逐渐增多经济专家把注意力转向了进化平稳策略(MaynardSmith,J.andPrice.G.R(1973))[4]与随机平稳状态(FosterandYoung1990)[5]等的研究、从短时间均衡转向了长期平稳性研究,所用的均衡概念从纳什均衡到进化平稳均衡再到了随机平稳性,从理想化的世界逐渐地转向了现实世界。

非合作博弈理论中最基本的均衡概念就是纳什均衡,它只能描述均衡点的局部静态性质;进化博弈理论基本均衡概念就是进化平稳策略,它是也是一个静态概念,但可以描述系统的局部动态性质;进化博弈理论其他重要概念就是随机平稳状态,它是一个动态概念,能够描述系统的全局动态性质。与前两者不同,随机平稳状态并没有是不动的,它只能描述系统的一种长期举动,从长期来说,系统在随机原因影响下绝大部分时间都处在某个均衡,下面分别阐述三个概念。

纳什均衡思想及其内涵

非合作博弈论研究面对利益矛盾的个体互动时,参与人的策略反映。给定利益矛盾每一个参与人务必从既定的选择集中做出选择。在博弈论中选择就是策略,选择集就是策略集。每一个参与对选择集中的各个策略都有既定的偏好,所有参与人的选择决定了博弈的结果。

博弈论关心的困难之一是:面对特定博弈,其解是什么?博弈论的最重要的解就是由博弈论理论家Nash(1951)在研究非合作博弈困难时提出来的纳什均衡。所谓纳什均衡策略是一个策略组合,是指在其余参与人选择适当的条件下,每一个参与人都选择得到最大支付的策略,换句话说,纳什均衡状态就是任何单独偏离不会得到改观的一种状态。下面给出纳什均衡的正式定义(张维迎《博弈论与信息经济学》1994,P69)[6]:

定义:有个参与人的战略表明式博弈,策略组合是一个纳什均衡,对每一个参与人,均为给定其余参与人选择时第个参与人的最优选择。

其实在求解纳什均衡时,就是解联立的偏微分方程组。显然,纳什均衡是一个局部最优而非全局最优均衡概念,所以,纳什均衡并没有能保证就是支付最高的不动点[1]。自此便引出了帕累托效率均衡:没有所有参与人都得到更高支付的其余选择的均衡就是帕累托效率均衡,用数学语言来描述(Menasché.D.S.et.al.(2005))

博弈论关心的困难之二是:参与人是如何执行策略选择的,为何会选择纳什均衡策略?非合作博弈理论假定参与人是完全理性的,在处理动态博弈时,还要求参与人满足序贯理性[2]这一比理性更强的要求。在这样强的假定下,参与人将对世界的任何改变全将做出最优反映,所以,假使存在均衡,那么参与人总会选择均衡策略,但在处理多重要均衡困难时,受于参与人很难推测对方的反映,所以,无法在多重均衡之间执行选择,即使博弈论理论对此执行了普遍而深入的研究,但正如KenBinmore在给Weibull(1995)[8]的“evolutionarygametheory”一书作的序言中表示:“HoweverdifferentgametheoristsproposedsomanydifferentrationalitydefinitionstheavailablesetofrefinementsofNashequilibriumbecameembarrassinglylarge,EventuallyalmostanyNashequilibriumcouldbejustifiedintermsofsomeoneorother’srefinement”。相关纳什均衡算法可参阅王则柯,李杰(2005)[9]。

进化平稳策略思想

进化平稳策略这一进化博弈理论的基本均衡概念是由生态学家MaynardSmith,J.andPrice.G.R(1973)在研究生态现象演化时提出来的。原初定义(见张良桥2003)[10]有很多制约条件如对称博弈、孤立的随机打击、参与人数目无限多等等。即使很多理论家从不同的方面对此概念执行了拓展,但他们提出的原初概念却能够很好表达出进化平稳策略的含义。下面先给出MaynardSmithandPrice(1973)的原初定义,然后,我们给出一种计算博弈进化平稳策略的方法。

设是矩阵,受于是对称博弈,所以可以用第一个参与人的支付矩阵来描述整个博弈,其中表明策略者与策略者博弈时,策略者所得的支付。几率向量(也就是混合策略),其中。

说策略是进化平稳的,假使满足:

而且,对,若有,那就要满足:

条件(4)表明了进化平稳策略一定是纳什均衡策略,条件(5)表明弱纳什均衡策略务必要满足的附加条件。显然,在对称博弈中,严格纳什均衡策略一定是进化平稳策略。

直观含义:首先,我们可以看出所有进化策略均为纳什均衡策略,所进化平稳策略集是纳什均衡策略集的子集,非纳什均衡策略就不是进化平稳策略;其次,由定义中的两个条件可以得出,平稳策略者与平稳策略者群体博弈时,突变策略者不会比平稳策略者好;假使突变策略者与平稳策略者一样好,那么,突变者策略与突变策略群体博弈时,就没有平稳策略者与突变策略群体博弈时好。也就是说,平稳策略具有对少数突变者的免疫力,在平稳状态时,突变者是难以易侵入的。

进化平稳策略的算法

计算进化平稳策略的方法首要有两大类:一是从动态过程出发,求出系统的平衡点,然后,再依据进化平稳策略的定义执行验证就可以了;其他方法就是直接用进化平稳策略定义来求。第一种方法涉及到具体的动态过程,而且只要知道动态过程就很容易求出进化平稳策略,本文略(可以参考张良桥2001)[11]。第二种方法就是通过定义来求,下面给出一种简单的处理方法。

依据纳什均衡的定义可以知道,假使策略是博弈的纳什均衡,那么,所有以正几率进入最优混合策略的纯策略均为最优的,参与人在所有这些纯策略所得的支付均为无差异的(见《博弈论与信息经济学》102-103页,张维迎),即有:

表明混合策略中非零几率的纯策略。假定存在且下标为的纯策略满足,令B是矩阵A中对应于非零纯策略的阶子矩阵。且令C为矩阵,其中代表元素为:。那么当且仅当C是负定的,就是进化平稳策略(见JohnHaigh1974)[12]。

证明:假定,而且存在,有,那么很显著有,其中是第个纯策略,即在同平稳策略者群体博弈时,突变策略者得到的支付比平稳策略者还要大,所以策略不是进化平稳策略,所以式(6)是进化平稳策略的必要条件。所以,对应于非零几率的纯策略满足:,对满足条件的策略有(注意):

对任意,当且仅当

有:。综上所述,利用该方法来求进化平稳策略的步骤如下:

首先,令个非零混合策略,然后解个方程:,定义B,C再考察矩阵C的所有特质根能否均是负,若均为负则所得的策略就是进化平稳策略。

如求对称博弈,它有两个进化平稳策略:。

假使某策略组合是严格纳什均衡策略,那就可以直接得出它就是进化平稳策略,但假使是弱纳什均衡策略,那就可运用上述的方法来执行判定。自此,可得到求博弈的进化平稳策略步骤:一是求出博弈所有的纳什均衡;二是由支付分析出其中的严格纳什均衡;三对非严格纳什均衡来说就代入上述方程,并分析能否为负定即可以求出博弈中所有进化平稳策略。

2.3随机平稳状态思想及其内涵

MaynardSmith,J.andPrice.G.R(1973)提出的进化平稳策略概念要求突变原因不接连且不重叠,它只能描述在单个随机原因影响下任何偏离均衡状态的举动全将伴随时间的演化自动回复到以前的进化平稳状态。现实中,经济系统常常会承受来自突变和其余偶然事件的打击,这些原因或许将对系统造成不可忽视的影响,FosterandYoung(1990)觉得,首先,原初ESS概念把影响系统的原因都看成是一个个孤立的事件,假定一个原因的影响消失以后,再考虑其他原因对系统的影响,而在现实中系统常常会承受接连的随机打击。实际上,现实中显现上述情形纯属偶然现象,一个只能处理偶然现象的理论是没有任何存在价值,即使单个随机原因对动态系统的影响较少,但它们却或许对系统造成累积作用而定量地更改系统的平稳性,致使系统离开进化平稳状态,系统何时回复到当初的进化平稳状态,依靠于动态过程的全局结构;其次,原初ESS定义是一个局部概念,所以在考虑随机打击时就不能作为分析系统平稳性的标准;又一次,受于系统的极限举动依靠于初始条件,同期在吸引子集合中只有一部分状态是随机平稳的,且随机平稳状态的选择还依靠于随机过程特定的结构,所以,ESS和没有充分地顾虑到随机原因对进化系统影响的吸引子(Attractor)在描述随机系统的平稳性时都不理想。

2.3.1随机平稳状态的定义

一般的进化模型中参与人均为选择那些相对于群体分布的最优反映策略,群体分布伴随时间的演化而为持续改变的,这是一种奈特未知性,而且在该种动态下,系统一定会收敛到协调博弈的严格纳什均衡,偶尔也或许显现极限环的情形,运用进化平稳策略概念任然无法在严格纳什均衡之间做出选择。Young(1990)第一次把影响系统的随机原因纳入到进化模型当中并提出了既不同于传统ESS也不同于吸引子(Attractor)的随机平稳性(StochasticStability)概念,把均衡选择困难转变成不同均衡的吸引域宽度比较困难,有最宽吸引域的均衡就是随机平稳状态。随机平稳状态的定义如下:

定义:群体向量是随机平稳的,假使伴随随机影响,极限密度对的每一个小邻域都赋有正几率;更精准地说:其中。其中是当时,的极限分布,表明随机原因对系统所造成的影响。

粗略地说,一个状态P是一个随机平稳的,假使在长期中,伴随随机打击原因影响的持续变少,系统差不多一定(nearlycertain)不会离开P的任意少的邻域。随机平稳的群体向量总是存在的,它有如下性质:伴随及,它是一个最小闭集。依据上述定义,随机平稳状态与系统所定义的动态相关,假使是支付单调动态而且有不变突变率,随机平稳状态直接由吸引域的宽度确定(参阅Young(1993)[13];MichihiroKandori,GreorgeJ,.Mailath,RafaelRob(KMR)1993[14];GlennEllison2000)[15]。

2.3.2随机平稳状态的算法

随机平稳状态是描述系统长期举动且由几率来定义的。假使系统是接连情形,那么可依据FosterandYoung(1990)通过求系统随机潜力的方法来求随机平稳状态,即有最小随机潜力的状态就是随机平稳状态。而现实中,多数情形均为离散的,下面将依据Freidlin,M.IandWentzell,A.D.(1984)[16]的方法来给出有多个常返状态情形下随机潜力的计算方法。该方法首先要求每个参与人在任何状态任什么时候候都以相同且不为零的突变率选择其余任何策略,如此就可以保证系统的遍历性,进而存在稳定分布。假定系统有五个状态,而且每两个状态之间的阻抗(左图中箭头上的数字表明从一个状态到其他状态的阻抗,右图是依据左图计算出来的):

状态之间没有标明数字就表明阻抗是无限大(其中的阻抗是依据突变率的指数来确定的),由上右表可以求出转移几率(由于我们导致为了求各个常返状态的阻抗,没有写出转移几率)。显然:该系统有四个常返状态。,,,,则不同常返状态之间的最小阻抗为(事实已经寻到了常返状态之间的最短路径)

四个常返状态对应的随机潜力分别为1536。所以,该动态系统的随机平稳状态就是具有最小随机潜力的状态即为。本例中直接给出各箭头旁边的数字,其目的是为了使困难简化,事实上它表明从一个状态到其他状态的阻抗,在处理事实困难时,需要具体分析;此外,此例没有深入到突变造成的过程中去,突变率的不同系统的随机平稳状态就不同。[1]

标签:

随机快审展示
加入快审,优先展示

加入VIP