协调博弈

简述

协调博弈，是指在博弈所定义的收益空间中，任何均衡点都符合下方条件：即

（1）在给定其余参与人举动策略的条件下，没有人有激励更改其举动策略；

（2）没有参与者期望其余参与者会愿意更改其举动。

类型

Jasmina Arifovic(2000); Hans Carlsson, Mattias Ganslandt(1998); Paul G.Straub(1995)等觉得协调博弈就是存在多个能够执行帕累托排序纳什均衡的博弈；

Vincent P.Crawford and Hans Haller(1990)；Vincent P.Crawford（1995）等觉得协调博弈是参与人对不同策略组合有相同偏好的博弈，假使其余人能够正确地预期，那么在多个纳什均衡中会存在唯一解，即均衡选择依靠参与人之间对博弈执行有充分类似的信念。

他们描述的侧着重不同，前者强调均衡多重性，后者强调参与人举动选择信念的统一性。诚然，没有多重均衡就不存在举动选择信念，有了多重均衡就需要探讨举动选择信念的形成过程，参与人之间举动预期是协调博弈均衡选择困难的核心之所在。

依据均衡选择时参与人之间是相同行动的举动预期依旧不同行动的举动预期而把协调博弈分为对称协调博弈与非对称协调博弈。

案例

夏娃靠左夏娃靠右 亚当靠左 3,3 0，0 亚当靠右 0，0 3，3

表：交通博弈

协调博弈的最为经典的弈局显现在“交通博弈”中。下表中的收益矩阵给出了一个交通博弈的收益分布。观察该矩阵可以发现：该矩阵有三个纳什均衡，即（靠左，靠左）、（靠右，靠右）以及一个靠左和靠右各占50％几率的混合动机策略均衡。所以，只要给定对方的选择，参与者就没有激励偏离均衡策略；或者即便不给定对方的策略，参与者也只能通过协调来达到均衡。

显然，在该种博弈中，每个参与者的策略困难是：他期望和他的对手就策略选择执行“协调”，由于不管能否给定对手的策略，协调的结果总是最好的。森在1967年的论文³中，将一个协调博弈称为“信心博弈”。他表示，协调博弈与囚徒窘境博弈刚好相反，每个参与者选择策略A或B，仅仅需要敢肯定对方也会相应地选择A或B。他们不像合作博弈那样需要一个有约束力的契约之类的东西，而是更需要在彼此之间确立一种相互信任的信心。

假使我们考虑将上述有关交通的协调博弈扩展为，（1）在固定参与者之间执行的重复博弈，或（2）在特定的群体系统内部非固定参与者之间执行的超博弈，那就不难想象，与其每次显现时都去试图处理这个博弈，远不如在举动人之间建立起某种举动或惯例的平稳的均衡模式，从而致使参与人在此后遇到相似困难时都可以加以遵循，而不需要反复支付信息成本和交易成本。但协调博弈的一个困难在于，均衡解具有未知性和多样性，所以哪种均衡的规则将被选择具有随机特质。所以，在习俗方面上讲，协调博弈的均衡规则是多样的。但不管怎样，只要相应的一种举动模式被普遍接受，并被自觉遵从，就会形成习俗或自发秩序，而且有利于包含参与者以内的所有群体成员，避免相似弈局中无效率的非均衡收益。

选举

在尧舜时代，自然资源相对丰富，人性淳朴，民众为争夺资源而执行争斗的情形相对较少。但是伴随时间的推动，人口的增长，以及人性的复杂化，为争夺资源所执行的争斗就更加激烈，且手段也花样百出了。尤其是在当前的市场经济情形下，民众以无限追逐物资利益为目标，一个人是否在激烈的竞争中获得资源控制权就形成一个人或者一个单位生存及发展的核心要素。对于市场经济还欠成熟，法制传统还比较欠缺的国度来看，不择手段地执行资源控制权争夺就特别重要。所以，一部分单位在同其它单位的资源或者市场控制权争夺中，事实上就是在玩“协调博弈 ”——给定其它单位不择手段地争夺资源，己方的最优策略就是不择手段地争夺资源。但是，是否有能力不择手段地去争夺资源是依靠于单位“领导”的人格素质的。

一般而论，能不择手段执行资源争夺的人一般是“胆大”的人，俗话说：“饿死胆小的，撑死胆大的”就是这个意思。而胆大的人一般又不太在乎社会公众舆论或者不太在乎社会规范的约束，一般就在“德行”上得分不高——即所谓大奸大恶之人，如三国时的曹操。所以，给定其它竞争性单位推选“大奸大恶之人”作领导，该单位也有动机推选自己的“大奸大恶之人”作领导，让他去迎战竞争方的“大奸大恶之人”是恰当的。诚然，“大奸大恶之人”也或许并没有受本单位广大人民民众的欢迎，但是作为集体的生存与发展，广大人民民众在一定程度上也或许容忍，让他们事实上并没有喜欢的人去当他们的领导，这叫做“以毒攻毒 ”！假使竞争对手推选他们的领导是德高望重之人而非“大奸大恶之人”，本单位推选“大奸大恶之人”也是要占便宜的，由于在争夺资源上德高望重之人是斗然而 “大奸大恶之人”的；如此一来，每个单位都选择“大奸大恶之人”就是“占优战略”的了。也就是说，无论竞争对手推选什么样的人作领导，本单位都推选“大奸大恶之人”作领导是最优的。如此的博弈事实上是“囚徒窘境 ”。但是，用“囚徒窘境”来描述事实现象没有用“协调博弈”恰当。理由是，一般“大奸大恶之人”也会损害本单位广大人民民众的利益。假使竞争对手单位推选德高望重之人当他们的领导，本单位广大人民民众一般也会推选本单位的德高望重之人作本单位领导的。由于即使本单位的领导是德高望重之人时不会比“大奸大恶之人”争夺导致许多的资源，但他也一般会比“大奸大恶之人”更少地损害本单位广大人民民众的利益，甚至一般还会增进本单位广大人民民众的利益。

一个更为强有力的原因是来自柏克利加州大学的Rabin教授的公平博弈看法。他依据近年来心理学实验的发现概括出民众广泛表现出的”互惠互损“举动准则。Rabin（1993）的一个有价值的贡献是把“公平性”（fairness）定义为“当别人对你友善良时你也对别人友善，当别人对你不善时你也对别人不善（即“投桃报李”和“以牙还牙”），而且他的独特贡献是将该种概念予以了清晰的规定，即“假使你在损失自己效用（收入，利益等）情形下去损害别人的效用（收入，利益等），就被定义为你对别人不善；假使你在损失自己效用（收入，利益等）情形下去增进别人的效用（收入，利益等），就被定义为你对别人友善。”

心理学的诸多实验证据显示人的举动在很多情形下是遵循如此定义的“公平性”规则的，尤其是在依照该种规则做出反映时所或许产生的潜在物质利益损失不太大的情形下更是这样。如此，当竞争对手单位推选“大奸大恶之人”作他们的领导时，实际上他们是以放弃让“大奸大恶之人”为他们导致许多资源的同期来增进本单位广大人民民众的利益。此时，依照Rabin的理论，本单位广大人民民众也会放弃让“大奸大恶之人”或许导致许多资源的好处而推选让德高望重之人来作本单位的领导。 ^[1]

参考文献

↑ 张良桥.协调博弈理论前沿研究新进度 ↑ 顾自安自发秩序演化的四类博弈困难 ↑ See Sen Amartya. (1967) “Isolation Assurance and the Social Rate of Discount”, Quarterly Journal of Economics, vol. 81.112-124. ↑ 蒲勇健.“杂皮”为何当“领导” ——基于协调博弈的思考

参考文献

推荐文章

热门文章

推荐文章

热门文章