首页百科经济理论博弈论文章详细

圣彼得堡悖论

外汇网2021-06-19 16:02:41 73

简述

圣彼得堡悖论是决策论中的一个悖论。圣彼得堡悖论是数学家丹尼尔·伯努利(Daniel Bernoulli)的表兄尼古拉·伯努利(Daniel Bernoulli)在1738提出的一个几率期望值悖论,它来自于一种掷币游戏,即圣彼得堡游戏(表1)。设定掷出正面或者反面为成功,游戏者假使首次投掷成功,得奖金2元,游戏终结;首次若不成功,继续投掷,第二次成功得奖金4元,游戏终结;如此,游戏者假使投掷不成功就反复继续投掷,直到成功,游戏终结。假使第n次投掷成功,得奖金2n元,游戏终结。依照几率期望值的计算方法,将每一个或许结果的得奖值乘以该结果发生的几率即可得到该结果奖值的期望值。

基本介绍

游戏的期望值即为所有机会结果的期望值之和。伴随n的放大,以后的结果尽管几率很小,但是其奖值越来越大,每一个结果的期望值都是l,所有机会结果的得奖期望值之和,即游戏的期望值,将为“无穷大”。依照几率的理论,多次试验的结果将令靠近于其数学期望。但是事实的投掷结果和计算都显示,多次投掷的结果,其平均值最多也就是几十元。正如Hacking(1980)所说:“没有人愿意花25元去参与一次如此的游戏。”这就显现了计算的期望值与事实情形的“冲突”,困难在哪里? 事实在游戏过程中,游戏的收费应当是多少? 决策理论的期望值准则在这里还成立吗?这是不是给“期望值准则”提出了严峻的考验? 正证实识和处理这一冲突对于民众认识随机现象、发展决策理论和指导事实决策无疑具有巨大意义。、

圣彼得堡困难对于决策工作者的启示在于,很多悖论困难可以归为数学困难,但它同期又是一个思维科学和哲学困难。悖论困难的实质是人类本身思维的冲突性。从广义上讲,悖论不仅包含民众思维成果之间的冲突,也包含思维成果与现实世界的显著的冲突性。对于各个学科各个层次的悖论的研究,历来是科学理论发展的活力。圣彼得堡悖论所反应的人类本身思维的冲突性,首先具有适当的哲学研究的意义;其次它反应了决策理论和事实之间的根本差别。民众总是不自觉地把模型与事实困难执行比较,但决策理论模型与事实困难并没有是一个东西;圣彼得堡困难的理论模型是一个几率模型,它不仅是一种理论模型,而且自身就是一种统计的 “近似的”模型。在事实困难涉及到无穷大的时机,连该种近似也变得不或许了。

论文解释

丹尼尔·伯努利对这个悖论的解答在1738年的论文里,提出了效用的概念以考验以金额期望值为决策标准,论文首要包含两条原理:

1、边际效用递减原理:一个人对于财富的占有多多益善,即效用函数一阶导数大于零;伴随财富的增长,满足程度的增长速度持续下滑,效用函数二阶导数差于零。

2、最大效用原理:在风险和不确定条件下,个人的决策举动准则是为了得到最大期望效用值而非最大期望金额值。

化解历史

圣彼得堡悖论的提出已有200多年了,所提出的化解方法大差不差可以归纳为下方几种看法:

(一)边际效用递减论

Daniel Bernoulli在提出这个困难的时机就给出一种处理办法。他觉得游戏的期望值计算不应当是金钱,而应当是金钱的期望效用,即利用众所周知的“期望效用递减律”,将金钱的效用测度函数用货币值的对数来表明:效用=log(货币值),如表 2所示。所有结果的效用期望值之和将为一个有限值log(4)≈ 0.60206,假使这里的效用函数符合事实,则理性决策应以4元为界。这一解释其实并没有能让人满意。姑且假定“效用递减律”是对的,金钱的效用可以用货币值的对数来表明。但是假使把奖金额变动一下,将奖金额提升为l0的2n次方(n=3时,奖金为108),则其效用的期望值仍为无穷大,新的悖论又显现了 诚然,我们并没有清楚效用值与货币值之间究竟有什么样的关系,然而只要我们依照效用的2n倍增长奖金,悖论就总是存在。

(二)风险厌恶论

圣彼得堡悖论对于奖金额大小没有制约,比如接连投掷40次才成功的话,奖金为1.1万亿元。但是这一奖金显现的几率极小,1.1万亿次才或许显现一次。事实上,游戏有二分之一的机会,其奖金为 2元,四分之三的可能得奖4元和2元。奖金越少,机会越大,奖金越大,机会越小。假使以前面 Hacking所说。花25元的费用冒险参与游戏会是非常愚蠢的,虽有得大奖的可能,但是风险太大。所以,考虑采取风险厌恶原因的方法可以化解冲突。Pual Weirich就提出在期望值计算中加人一种风险厌恶因子,并得出了游戏费用的有限期望值,觉得该种方法事实上处理了该悖论。

但是该种方法也并没有十分完美。首先,并不是所有人均为风险厌恶的,相反有很多人喜欢冒险。如每期必买的彩票,以及Casino(卡西诺)纸牌游戏,其价格都好于得奖的期望值。你也可以说这些喜欢冒险买彩票和赌博的人是非理性的,可他们自有乐趣,喜欢如此的风险刺激。总之,风险厌恶的看法很难解释清楚事实游戏平均值非常有限的困难。退一步说,即使承认风险厌恶的看法,冲突依然不能清除。我们依然可以调整奖金额,最后,考虑风险厌恶情形的期望值依然是无穷大而与事实情形不符。

(三)效用上限论

对前两种看法的反驳,我们采取了增长奖金额的方法来弥补效用的递减和风险厌恶,两者均是假定效用可以无限增长。也有一种看法觉得奖金的效用或许有一个上限,如此,期望效用之和就有了一个极限值。Menger觉得效用上限是惟一能化解该悖论的方法。设效用值等于货币值,上限为100 单位,则游戏的期望效用为7.56l25,如表3所示。也许这里的效用上限太小了,然而我们可以任意选定一个更大的值比如225 。有多人如Russell Har—din (1982),W illiam G uNtaNon (1994),Richard Jeffrey(1983)等都赞成如此的看法。然而该种效用上限的看法疑似不太让人信服。效用上限与效用递减不同,恐怕你觉得有225 的钱够自己花的了,可是钱并没有能给我们导致所有的效用,有些东西不是钱所能买来的。效用上限代表着再也没有价值可以添加了。但是一个人有了钱,还期望他的朋友、亲戚也像他一样富裕;同一个城市里的人和他一样富裕...。而效用上限论觉得到了这一上限他们就不用再做任何交易了,看上去这并没有能成立。对有些人来讲,疑似期望和需求并没有是无限增长的,对于现有的有限需求他们已经满足了。他们认为这里的游戏期望效用值的确是有限的。然而是不是的确有如此的人依旧一个不确定的困难,或者是个经验性的困难。但觉得“越多越好”的人的确是存在的。对于决策准则如此的理性选择的理论,不能基于可疑的和经验性的分析而加以制约,因此期望有限论不足够化解这里的冲突。

(四)结果有限论

Gustason觉得,要避免冲突,务必对期望值概念执行制约,其一是制约其结果的数目;其二是把其结果值的大小制约在适当的规模内。这是典型的结果有限论,这一看法是从事实出发的。由于事实上,游戏的投掷次数总是有限的数。比如对游戏设定某一个投掷的上限数L,在投掷到这个数的时机,假使依然没有成功,也终结游戏,不管你还能再投多少,就依照L付钱。由于你即使不设定L,事实上也总有投到头的时机,人的寿命总是有限的,任何原因都可以致使游戏中止。当下设定了上限,期望值自然也就可以计算了。

困难是,这已经不是以前的那种游戏了!同期也并没有证明以前的游戏期望值不是无限大。以前的游戏见底存在吗? Jeffrey说:“任何供应这一游戏的人均为一个骗子,谁也没有无限大的银行!” 是说事实上没有该种游戏吗? 恐怕这也不见的。假使我邀请你玩该种游戏,你说我事实上不是在如此做吗? 或者说我事实上邀请你玩的不是该种游戏而是此外的什么游戏? 很多游戏场供应很多几率极小、奖金额极大差不多不或许的游戏,他们依然在运营、在赚钱,照样吃饭睡觉,一点儿也不担忧哪一天会欠下一屁股债,崩盘倒闭。

Jeffrey在如此说的时机,事实上是承认了圣彼得堡游戏的期望值是无穷大了。觉得游戏厅不供应如此的游戏,正是由于他们觉得其期望值是无穷大,迟早他们会所以而破产倒闭。这正是用了普通的决策理论,而倒过来又说该种游戏事实上不存在,应当消除在期望值概念之外。所以,用制约期望值概念的方法并没有能化解悖论。

不能制约期望值概念的原因仍有很多。比如,我们不能用制约期望值概念的方法仅把圣彼得堡游戏消除在外,而应当是通用的。在人寿保险中,有一个险种依据保险人的年纪,每长一岁给付适当的赔付金额。采取人类寿命的经验曲线给出每个年纪的生存机会。大于140岁的生存率已经没有经验可以借鉴,但可以采取适当的函数将生存年纪扩展至无穷大,诚然其生存率趋向于零。注意到这里的给付金额也是无限的,但是其在期望值计算方面并没有显现什么困难。

困难的本质

所谓悖论, 《辞海》中的定义是:“一命题B,假使承认B,可推得非B,反之,假使承认非B,又可推得

B,称命题B 为一悖论。”可见,作为一种推理的冲突现象,悖论是民众自己制造出来的。当下已经有人证明,该种意义上的悖论是不存在的。一个命题是一个具有真假的分析语句,假使一个命题B 和非B 能够相互推出,则B要么是非真非假的单义句,要么是非真非假的多义句。所以,悖论作为人类思维系统的一种冲突形式,它的化解务必从民众思维系统本身的冲突性和不完善性着手,需要人类战胜和超越自己。有记录以来一次一次的悖论的化解,提出了更完备的公理系统,完善了人类的思维和科学系统,致使科学得到更深一步的成长。圣彼得堡悖论也是一样。

(一)对圣彼得堡悖论各种化解看法的评述

综合上述悖论的化解看法,效用递减论符合了 “边际效用递减律”,能够在一定程度上处理事实困难,但是却绕开了困难的基本分析。圣彼得堡游戏的期望值见底是多少并没有真正得到处理;风险厌恶论,犯了同样的错误,只然而是用风险因子替换了效用函数,事实上导致一种风险效用;效用上限论和结果上限论尝试回避困难的无限性,篡改了原困难,自然也不或许处理困难。这些看法均为从事实出发的,但都没有刷新民众的思维系统,不能冲破自己思想的牢笼,即使处理了这一悖论,又会有新的悖论显现。

(二)最后的化解

从上述圣彼得堡悖论的化解方法来说,其效果都不是十分理想,都没有真正处理困难。但是正是这些付出,是我们认识到仅从事实出发是不能处理困难的,而最合理的解释就是— — 保留期望值的定义,调整我们的思维。当我们如此做的时机,圣彼得堡悖论就不再是一个悖论了!理论上期望值的计算没有什么错误,我们需要承认它的期望值是无穷大;而事实上它的均值又不或许是无穷大,由于它是样本均值,样本均值伴随样本容量的增长,以几率收敛于其期望值。这均为正常的,它们自身就是应当有差距的!至于差距应当有多大,在差于无穷大的时机,样本均值伴随实验次数的增多,越来越靠近总的均值(或理论均值),圣彼得堡游戏不正是如此的吗? 而在总的均值是无穷大的时机,我们如何让样本均值如何靠近无穷大呢? 非得是我们觉得的很大很大吗?再大也不是无穷大,和当下也没有区别,我们平时的“大小”概念已经不适应了。涉及无穷大约念比较的时机,就需要用相应的比较方法。圣彼得堡游戏的结果集合是一个无穷集合,而事实实验的样本是一个有穷集合,它们是不能用现有的办法比较的。

利用电脑执行模拟试验的结果表明,事实试验的平均值— — 样本均值是伴随实验次数的增长而改变的。在大批实验以后,其实验均值X可以近似表明为X≈logn/log2,可见当实验次数趋向无穷大的时机,样本均值也趋向无穷大。比如100万即106次实验的平均值约等于6/0.301=19.9,即 20元左右;要样本均值高达1 000元,实验次数就要高达10332,这时候有机会显现的最高投掷次数约为1000次左右,相应的最高赔付金额为 ,已经高达了天文数字了。假使伴随实验次数趋向无穷大,趋向于无穷大的进展是慢多了。

与现实的启示

尽管圣彼得堡游戏困难导致一个具体困难,但是相似的事实决策困难是存在的。它们起码是可观察的,其观察值的确也是存在的。而且它的确也给决策的期望值准则提出了考验,所提出的困难需要我们予以解答。通过上述困难的化解,我们起码可以给出下列相关困难的答案和启示。

首先,理论上应当承认圣彼得堡游戏的“数学期望”是无穷大的。但理论与事实是有差别的,在涉及无穷大决策困难的时机,务必注意该种差别。

其次,事实试验中伴随游戏试验次数的增长,其均值将令越来越大,并与实验次数呈对数关系,即样本均值=log

2(实验次数)=log(实验次数)/log2。

又一次,事实困难的处理依旧要依据具体困难执行具体分析。前面的圣彼得堡悖论化解方法均为很实用的方法。也--I以设计其余方法,比如可以运用“事实推断原理”,依据实验次数n设定一个相应的“小几率”,对于圣彼得堡困难来讲,是一个很事实的方法;或者建立一个近似模型,比如确定一个最大或许成功的投掷次数n,将投掷n 1次以后的几率设为1 / 2k,依然符合几率分布的条件(所有结果的几率之和等于1)等等。

最后,圣彼得堡困难对于决策工作者的启示在于,很多悖论困难可以归为数学困难,但它同期又是一个思维科学和哲学困难。悖论困难的实质是人类本身思维的冲突性。从广义上讲,悖论不仅包含民众思维成果之间的冲突,也包含思维成果与现实世界的显著的冲突性。对于各个学科各个层次的悖论的研究,历来是科学理论发展的活力。圣彼得堡悖论所反应的人类本身思维的冲突性,首先具有适当的哲学研究的意义;其次它反应了决策理论和事实之间的根本差别。民众总是不自觉地把模型与事实困难执行比较,但决策理论模型与事实困难并没有是一个东西;圣彼得堡困难的理论模型是一个几率模型,它不仅是一种理论模型,而且自身就是一种统计的 “近似的”模型。在事实困难涉及到无穷大的时机,连该种近似也变得不或许了。

决策科学是一门应用学科,它的研究需要自然科学和社会科学的各种基础理论和方法,包含数学方法。这些方法都具有很强的理论性和高度抽象性。但是,决策科学更是一门应用性、实践性很强的学科,要求决策理论与决策实践紧密结合。所以,我们在决策理论的研究和处理事实困难的时机,应高度重视理论和实践的关系。理论模型的建立,既要因为实践,又不能囿于实践,发挥主观创造力,才可有所击穿,有所建立。

标签:

随机快审展示
加入快审,优先展示

加入VIP