首页百科经济理论博弈论文章详细

逆向归纳法

外汇网2021-06-19 16:02:49 90

逆向归纳法(backward induction)是求解动态博弈均衡的方法

概念

逆向归纳法是博弈论中一个比较古老的概念,它的提出最早可以追溯到泽梅罗(1913) 针对国际象棋有最优策略解的证明,后来民众将其推广到了更大量的博弈中,比如,在有限完美信息扩展型博弈中,就是用逆向归纳法(BI)来证明子博弈完美均衡(SPE)的存在以 及求解 SPE,其基本思路是从动态博弈中的最后一个阶段开始,局中人都遵循效用最大化原则选择行动,然后逐渐倒推上前一个阶段,一直到博弈开始局中人的行动选择,其逻辑严密性毋庸置疑。但是,当从终点往前推到某一决策点时,BI 完全忽视了到达该决策点的以往历史行动,而这一历史行动诚然会影响处在该决策点的局中人相关其对手将来如何采取措施的信念,比如,一个局中人假使观察到对手在以往没有依照 BI 执行行动选择,那么他就有理由相信他的对手仍会采取同样的模式执行下去,但是通过该种信念修正以后所做的选择就会与 BI冲突。为了高达均衡解,为了能按 BI执行推理求解,我们需要对局中人的信念或者说知识增长一部分制约性条件,也就是说在什么样的前提下,BI 是合理的,显然,仅仅要求每个局中人都理性是不够的,所有的局中人都务必知道所有的局中人均为理性的,所有的局中人都务必知道所有局中人都知道所有局中人均为理性的……等等以至无穷,在如此的认知条件基础下,我们就不会偏离 BI,即, “在完美信息扩展型博弈中,理性的公共知识蕴含了BI”(Aumann 1995)。

逆向归纳法(backward induction)是求解动态博弈均衡的方法。所谓动态博弈是指博弈参与人的行动存在着先后次序,而且后行动的参与人能够观察到前面的行动。逆向归纳法在逻辑上是严密的,但是它存在着“窘境”。所谓逆向归纳法是从动态博弈的最后一步往回推,以求解动态博弈的均衡结果。逆向归纳法又称逆推法。它是完全归纳推理,其推理是演绎的,即结论是必然的。 在完全且完美的动态博弈中,先举动的理性博弈人,在前面阶段选择策略时,必然会考虑后行博弈人在后面阶段中将令怎样选择策略。因此,只有在博弈的最后一个阶段,不再有后续阶段牵制的情形下,博弈人才可做出明智的选择。在后面阶段博弈人选择的策略确定后,前一阶段的博弈人在选择策略时也就相对容易。

逆向归纳法就是从动态博弈的最后一个阶段开始分析,逐渐向前归纳出各阶段博弈人的选择策略。

逆向归纳法的逻辑基础:动态博弈中先行动的参与人,在前面阶段选择举动时必然会考虑后行动的参与人在后面阶段中的举动选择,只有在最后一阶段的参与人才可不受其余参与人的制衡而直接作出选择。而当后面阶段的参与人的选择确定后,前一阶段的参与人的举动也就容易确定了。逆向归纳法消除了不可信的威胁或允诺。

运用

逆向归纳法:它的精髓就是“向前展望,向后推理”,即首先仔细思考自己的决策或许引起的所有后续反映,以及后续反映的后续反映,直至博弈终结;然后从最后一步开始,逐渐倒推,以此找出自己在每一步的最优选择。

图1的求解过程如下:

(a)若2在右,2将选择进(0.3);∵(0.3)>(3.0)

(b)若2在左,2将选择退(3.0);∵(3.0)>(-1.-1)

(c)在2的选择中1的最大收益是选择进;∵(3.0)>(0.3)

∴纳什均衡为(进(进,退))均衡解为(进,退),均衡收益为(3.0)

(2)逆向归纳法仅适合有限步动态博弈,而并要求制定人犯的机会性很小。

假使运用逆向归纳法得到的结果是A选择右边的行动,双方各得3。

假使A在第一步选择下边的行动,B该做何想?只有当A在第二步犯错误的机会性差于1/11时,B才有胆量选择让游戏继续玩下去。于是A极有机会得到10这个最大回报。

标签:

随机快审展示
加入快审,优先展示

加入VIP