颤抖手精炼均衡(trembling hand perfect equilibrium)
概念
“颤抖手精炼均衡”概念是泽尔腾提出的对纳什均衡的一个改进。颤抖手精炼均衡的基本思想是:在任何一个博弈中, 每个局中人都有适当的犯错误的机会性(相似一个人用手抓东西时,手一颤抖,他就抓不住他想抓的东西)。一个策略对是一个颤抖手精炼均衡时,它务必具有如下性质:各局中人i要采取的策略,不仅在其余局中人不犯错误时是最优的,而且在其余局中人偶尔犯错误(几率很小,但大于0)时依旧最优的。可以看出,颤抖手精炼均衡是一种较平稳的均衡。从博弈论中我们知道,泽尔腾的该种“颤抖手均衡(trembling hand equilibrium)”也是一种精炼纳什均衡。大差不差说来,泽尔腾(1975)假定,在博弈中存在一种数值极小但又不为0的几率,即在每个博弈者选择对他来看所有可行的一项策略时,或许会偶尔出错,这就是所谓的“颤抖之手”。因之,一个博弈者的均衡策略是在顾虑到其对手或许“颤抖”(偶尔出错)的情形下对其对手策略选择所作的最好的策略回应。单从这一点来说,在演进博弈论中,最初的演进平稳性的显现,并没有完全来自博弈双方的理性计算,而事实上或许是随机形成的(往往取决于博弈双方“察言观色”的一念之差)。依照这一分析思路,我们也可以觉得,民众对一种习俗(演进平稳性)的偏离,也或许出自泽尔腾所说的那种民众社会博弈中的“颤抖”。
价值
为了表明颤抖手精炼均衡的价值,我们考虑一个具有两个“委托人—代理人”对和两种自然状态的对称支付模型。设代理人1的策稍有:α1(积极工作)和α2(偷懒);代理人2的策略同样有β1(积极工作)和β2(偷懒)。相应于两个代理人的策略,在自然状态s1和s2下,每个委托人的收益如下:状态s1(坏)状态s2(好)
β1β2 β1β2
α1(c1,c2)(d1,a2) α1(d1,d2)(e1,b2)
α2(a1,d2)(b1,b2) α2(b1,e2)(c1,c2)
其中,00单位的额外收益。所以,代理人的收益,可用如下标准形的二人非零和博弈给出:
状态s1(坏)
α1β1( U1, U2)β2( U1-M)
α2 (-M, U2) (-M,-M)
状态s2(好)
α1β1( U1, U2)β2( U1,-M)
α2 (-M, U2) ( U1+l1, U2+l2)
如此,在好的环境s2中,代理人之间的博弈有2个纳什均衡:(α1,β1)对应收益对( U1, U2)和(α2,β2)对应收益对( U1,+l1, U2+l2);而在坏的状态s1中,代理人间的博弈只有一个非合作均衡(α1,β1)对应收益对( U1, U2)。观察上述博弈,我们发当下状态s2中,(α1,β1)愈加有效率(使每个委托人的收益都较大),但是两个代理人却更喜欢均衡(α2,β2),由于这个均衡使他们的效用从( U1, U2)涨到( U1,+l1, U2+l2)。但是,假使这两个纳什均衡中只有(α1,β1)是颤抖手精炼均衡,代理人就或许不再偏爱均衡(α2,β2)。