几率论
研究随机现象数量规律的数学分支。随机现象是指如此的客观现象,当民众观察它时,所得的结果不能预先确定,而导致多种或许结果中的一种。在自然界和人类社会中,存在着大批的随机现象。比如,掷一硬币,或许显现正面或反面;测量一物体长度,受于仪器及观察承受环境的影响,每次测量结果或许有差异;在与一工艺条件下生产出的灯泡,其寿命长短参差不齐;等等。这些均为随机现象。随机现象的达到和对它的观察称为随机试验,随机试验的每一或许结果称为一个基本事件, 一个或一组基本事件又通称随机事件,或简称事件。事件的几率则是衡量该事件发生的机会性的量度。尽管在一次随机试验中发生某个事件是带有偶然性的,但那些可以在相同条件下大批重复的随机试验却往往呈现出显著的数量规律性。民众在长期实践中已逐渐觉察到某些如此的规律性,并在事实中应用它。比如,接连多次掷一均匀的硬币,显现正面的频率(显现次数与投掷次数之比)伴随投掷次数的增长渐渐平稳于1/2。又如,多次测量一物体的长度,其测量结果的平均值伴随测量次数的增长,渐渐平稳于一常数,而且诸测量值大都落在此常数的近旁,越远则越少,因之其分布情况呈现“中间大、两头小”及某种程度的对称性(即近似于正态分布)。大数律及中心极限定理就是描述和论证这些规律性的。在事实中,民众往往仍需要研究在时间推动中某一特定随机现象的演变情形,描述该种演变的就是几率论中的随机过程。比如,某一电话交换台从一确定时刻起到其后的每一时刻为止所收到的呼唤次数便是一随机过程。又如,微小粒子在液体中因受周围分子的随机碰撞而形成不规则的运动(即布朗运动)也是一随机过程。研究随机过程的统计特性,计算与过程相关的某些事件的几率,尤其是研究与过程样本轨道(即过程的一次达到)相关的困难,是现代几率论的首要课题。总之,几率论与事实有着紧密的联系,它在自然科学、技术科学、社会科学、军事和工农业生产中都有大量的应用。几率论依旧数理统计学的理论基础。
几率论发展简史
几率论有悠久的历史,它的起源与博弈困难相关。16世纪,意大利的一部分学者开始研究掷骰子等赌博中的一部分简单困难,比如比较掷两个骰子显现总点数为9或10的机会性大小。17世纪中叶,法国数学家布莱兹·帕斯卡尔、P.de费马及荷兰数学家C.惠更斯基于排列组合的方法(见组合数学)研究了一部分较复杂的赌博困难,他们处理了“合理分配赌注困难”(即“得分困难”,见几率)、“输光困难”等等。其方法不是直接计算赌徒赢局的几率,而是计算期望的赢值,进而致使了现今称之为数学期望的概念(由惠更斯清晰提出)。使几率论形成数学的一个分支的真正奠基人则是瑞士数学家雅各布第一·伯努利,他建立了几率论中第一个极限定理,即伯努利大数律;该定理笃定:设事件A的几率P(A)=p(0
式中ε为任一正实数。这一结果发表于他死后8年(1713)出版的遗著《推测术》(Ars conjectandi)中。这里所说的事件的几率,应理解为事件发生的可能的一个测度,即公理化几率测度(详见后)。1716年前后,A.棣莫弗对p =1/2情形,用他导出的有关n!的渐近公式(,即所谓斯特林公式)更深一步证明了渐近地服从正态分布(德国数学家C.F.高斯于1809年研究测量误差理论时从新导出正态分布,所以也称为高斯分布)。亚伯拉罕·棣莫弗的这一结果后来被法国数学家P.-S.拉普拉斯推广到一般的p(0
在几率发展史中特别值得指出的是柯尔莫哥洛夫在1933年建立了几率论的公理化体系。
几率论公理化体系的建立
早在拉普拉斯给出几率的古典定义以前,民众就提出了几何几率的概念,这是研究有无穷多个或许结果的随机现象困难的,著名的布丰(曾译蒲丰)投针困难 (1777)就是几何几率的一个早期例子。19世纪,几何几率逐渐发展起来。但到19世纪末,显现了一部分自相冲突的结果。以著名的贝特朗悖论为例:在圆内任作一弦,求其长胜过圆内接正三角形边长的几率。此困难可以有三种不同的解答:①受于对称性,可预先指定弦的方向。作垂直于此方向的直径,只有交直径于 1/4点与3/4点间的弦,其长才大于内接正三角形边长。设所有交点是等或许的,则所求几率为 1/2(图1之a)图② 受于对称性,可预先固定弦的一端。仅当弦与过此端点的切线的交角在60°~120°之间,其长才合乎要求。设所有方向是等或许的,则所求几率为1/3(图 1之b)。③弦被其中点位置惟一确定。只有当弦的中点落在半径缩减了二分之一的同心圆内,其长才合乎要求。设中点位置均为等或许的,则所求几率为1/4(图1 之c)。这个困难之所以有不同解答,是由于当一随机试验有无穷多个或许结果时,有时很难客观地规定“等或许”这一概念。这反应了几何几率的逻辑基础是不够严密的。几何几率这类困难表明了拉普拉斯有关几率的古典定义带有很大的局限性。当严密的几率公理化系统建立后,几何几率才可健康地发展且有大量的应用。
尽管到了19世纪下半叶,几率论在统计物理学中的应用及几率论的本身发展已击穿了几率的古典定义,但有关几率的一般定义则始终未能清晰化和严格化。该种情形既严重影响了几率论的更深一步发展和应用,又落后于当时数学的其余分支的公理化潮流。1900年,D.希尔伯特在世界数学家大会上公开提出了建立几率论公理化体系的困难,最先从事这方面研究的是(J.-)H.庞加莱、(F.-É.-J.-) É.波莱尔及С.Η.伯恩斯坦。有关几率论与测度论有联系这一重要思想就出自波莱尔。伯恩斯坦于1917年构造了几率论的第一个公理化体系。20年代以后,陆续显现了 J.M.凯恩斯及R.von米泽斯等人的工作。凯恩斯力争把任何命题都看作是事件。比如,“明日将下雨”,“土星上有生命”,“某出土文物是某年代的产品”,等等。他把一事件的几率看作是民众依据经验对该事件的可信程度,而与随机试验没有直接联系,所以,一般称为主观几率。从凯恩斯起,对主观几率提出了几种公理体系,但没有一种堪称权威。也许,主观几率的最大影响不在几率论领域本身,而在数理统计学中近年来显现的贝叶斯统计学派。和主观几率学派相对立的是以米泽斯为代表的几率的频率理论学派。米泽斯把一事件的几率定义为该事件在独立重复随机试验中显现的频率的极限,并把此极限的存在性作为他的第一条公理。他的第二条公理是,对随机选取的子试验序列,事件显现的频率的极限也存在而且极限值相等。
严格说来,这第二条公理没有确切的数学含义。所以,该种所谓公理化在数学上是不可取的。另外,象某个事件在一独立重复试验序列中显现无穷多次这一事件的几率,在米泽斯理论中是无法定义的。该种频率法的理论根据是强大数律,它具有较强的直观性,易为事实工作者和物理学家所接受。但伴随科学的进步,它又已渐渐被绝大部分物理学家所抛弃。
20世纪初完成的勒贝格测度(见测度论)和勒贝格积分理论以及随后发展起来的抽象测度和积分理论,为几率论公理体系的确立奠定了理论基础。民众通过对几率论的两个最基本的概念即事件与几率的长期研究,发现事件的运算与集合的运算完全相似,几率与测度有相同的性质。到了30年代,伴随大数律研究的深入,几率论与测度论的联系愈来愈显著。比如强、弱大数律中的收敛性(见几率论中的收敛) 与测度论中的差不多处处收敛及依测度收敛完全相似。在该种环境下,柯尔莫哥洛夫于1933年在他的《几率论基础》一书中首次给出了几率的测度论式的定义和一套严密的公理体系。这一公理体系着眼于规定事件及事件几率的最基本的性质和关系,并用这些规定来显示几率的运算法则。它们是从客观事实中抽象出来的,既概括了几率的古典定义、几何定义及频率定义的基本特性,又避免了各自的局限性和含混之处。这一公理体系一经提出,便快速得到举世的公认。它的显现,是几率论发展史上的一个转折点,为现代几率论的蓬勃发展打下了坚实的基础。
现代几率论的内容
受于科学技术中很多事实困难的助推以及几率论逻辑基础的建立,几率论从20世纪30年代以来得到了快速的成长。
当前其首要研究内容大差不差可分为极限理论,独立增量过程,马尔可夫过程,稳定过程和时间序列,鞅和随机微分方程,点过程等。另外,包含组合几率(用组合数学方法处理只涉及有限个基本事件的几率困难)、几何几率等以内的一部分属于古典范畴的困难,迄今仍有人在继续研究,并有新的成长。
极限理论是研究与随机变量序列或随机过程序列的收敛性相关的困难的理论。20世纪30年代以后,相关随机变量序列的极限理论(首要是中心极限定理)的研究,是将独立序列情形的结果推广到鞅差序列和更一般的弱相依序列等情形,以及研究收敛速度困难。近年来,受于统计力学的需要,民众开始研究强相依随机变量序列的非中心极限定理。
从1951年M.唐斯克提出不变原理(见随机过程的极限定理)后,相关随机过程序列的弱收敛的研究成了极限理论的一个中心课题。ю.Β.普罗霍洛夫及A.B.斯科罗霍德在这方面做出了最首要的贡献。1964年V.斯特拉森的工做出现后,引起了相关随机过程序列的强收敛的研究,这就是强不变原理。近年来,鞅论方法已渗透到这一领域,使很多经典结果的证明得到简化和统一处理,而且还致使一部分新的结果。
民众最早知道的独立增量过程是在物理现象中观察到的布朗运动和泊松过程,一般的独立增量过程的研究,归功于莱维,它在20世纪40年代已臻成熟。在这些研究中,包含了很多重要的方法和概念,几率论的很多近代研究课题都直接或间接地受其启发与影响。
在事实中遇到的很多随机现象有如下的共同特性:它的将来的演变,在已知它当前状态的条件下与以往的情况无关。描述该种随时间推动的随机现象的演变模型就是马尔可夫过程。
20世纪50年代以前,研究马尔可夫过程的首要工具是微分方程和半群理论(即分析方法);1936年前后就开始探讨马尔可夫过程的轨道性质,直到把微分方程和半群理论的分析方法同研究轨道性质的几率方法结合运用,才使这方面的研究工作更深一步深化,并形成了对轨道分析必不可少的强马尔可夫性概念。1942 年,伊藤清用他创立的随机积分和随机微分方程理论来研究一类特殊而重要的马尔可夫过程──扩散过程,开辟了研究马尔可夫过程的又一重要渠道。近年来,鞅论方法也已渗透到马尔可夫过程的研究中,它与随机微分方程结合在一起,已形成当前处理多维扩散过程的工具。另外,马尔可夫过程与分析学中的位势论有紧密的联系。对马尔可夫过程的研究,助推了位势理论的成长,并为研究偏微分方程给予了几率论的方法。近期十多年发展起来的吉布斯随机场和无穷粒子随机系统,是受于统计物理的需要而提出的。
很多自然的和生产过程中的随机现象表现出某种稳定性。一种稳定性是过程在任意一部分时刻上的联合几率分布随时间推动不变,该种稳定性称为严稳定性。严稳定过程的研究与遍历理论有紧密的联系。假使上述对几率分布的要求放宽为仅对二阶有关矩的要求,即过程在任意两时刻上的协方差随时间推动不变,则称该种稳定性为宽稳定性。有关宽稳定过程的研究,辛钦、柯尔莫哥洛夫和维纳等人运用傅里叶分析和泛函分析的工具,在40年代已经找出了过程的有关函数及过程自身的谱分解式,而且较完满地处理了有应用意义的预期困难。很多应用困难还要求依据观测报告去建立该数据所来自的随机过程的模型。为此造成了时间序列分析这一课题,提出了宽稳定序列的自回归滑动平均(ARMA)模型以及一部分非线性模型。
鞅是另一类重要的随机过程。从20世纪30年代起,莱维等人就开始研究鞅序列,把它作为独立随机变量序列的部分和的推广。40年代到50年代初,杜布对鞅执行了系统的研究,得到有名的鞅不等式、停止定理和收敛定理等重要结果。1962年,P.A.迈耶处理了杜布提出的接连时间的上鞅分解为鞅及增过程之差的困难。在处理这个困难的过程中,显现了很多新鲜而深刻的概念,使鞅和随机过程一般理论的内容大大丰富起来。鞅的研究丰富了几率论的内容,并引起民众用它所供应的新方法新概念对几率论中很多经典的内容从新审议,把以往觉得是复杂的东西纳入鞅论的框架而加以简化。另外,利用上鞅的分解定理,可以把伊藤清的对布朗运动的随机积分推广到对一般鞅乃至半鞅的随机积分;因此,更一般的随机微分方程的研究也跟随发展。随机微分方程理论不仅可以用来研究马尔可夫过程,它依旧处理滤波困难的必要工具。近期显现的流形上的随机微分方程又和微分几何及分析力学的研究发生了紧密的联系。鞅论还对本学科以外的位势理论、调和分析及复变函数论等给予了有用的工具。
点过程是从所谓计数过程发展出来的,它们的特点是,可用落在不相重叠的集合上的随机点数目的联合几率分布来刻画整个过程的几率规律。最基本的计数过程是泊松过程,1943年,C.帕尔姆将它作为最简单的输入流应用于研究电话业务困难;1955年,辛钦又以严密的数学看法作了整理和发展。
在60年代以前,点过程的研究首要限于泊松过程及其推广的过程。以后,受于大批事实困难的需要以及随机测度论和现代鞅论的助推,更深一步把实轴上的点过程(即计数过程)推广到一般的可分完备度量空间上,以内容和方法上都有根本性的进度。
现代几率论的应用
几率论的成长史表明了理论与事实之间的紧密关系。很多研究方向的提出,归根见底是有其事实背景的。倒过来,当这些方向被深入研究后,又可指导实践,更深一步扩大和深化应用规模。几率论作为数理统计学的理论基础是尽人皆知的。下面简略介绍一下几率论自身在各方面的应用情形。
在物理学方面,高能电子或核子穿过吸收体时,造成级联(或倍增)现象,在研究电了-光子级联过程的起伏困难时,要用到随机过程,常以泊松过程、弗瑞过程或波伊亚过程作为事实级联的近似,有时还要用到更新过程(见点过程)的概念。当核子穿到吸收体的某一深度时,则可用扩散方程来计算核子的几率分布。物理学中的放射性衰变,粒子计数器,原子核照相乳胶中的径迹理论和原子核反映堆中的困难等的研究,都要用到泊松过程和更新理论。湍流理论以及天文学中的星云密度起伏、辐射传递等研究要用到随机场的理论。探讨太阳黑子的规律及其预期时,时间序列方法非常有用。
化学反映活力学中,研究化学反映的时变率及影响这些时变率的原因困难,自动催化反映,单分子反映,双分子反映及一部分连锁反映的活力学模型等,都要以生灭过程(见马尔可夫过程)来描述。
随机过程理论所供应的方法对于生物数学具有很大的重要性,很多研究工作者以期来构造生物现象的模型。研究群体的上涨困难时,提出了生灭型随机模型,两性上涨模型,群体间竞争与生尅模型,群体迁移模型,上涨过程的扩散模型等等。有些生物现象还可以利用时间序列模型来执行预报。传染病流行困难要用到具有有限个状态的多变量非线性生灭过程。在遗传困难中,着重研究群体经历多少代遗传后,进入某一固定类和第一次进入此固定类的时间,以及最大基因频率的分布等。
很多服务系统,如电话通信,船舶装卸,机器损修,病人候诊,红绿灯交换,存货控制,水库调度,购货排队,等等,都可用一类几率模型来描述。这类几率模型涉及的过程叫排队过程,它是点过程的特殊情况。排队过程一般不是马尔可夫型的。当把顾客到达和服务所需时间的统计规律研究清楚后,就可以合理安排服务点。
在通信、雷达探测、地震探测等领域中,都有传递信号与接收信号的困难。传递信号时会承受噪声的干扰,为了精准地传递和接收信号,就要把干扰的性质分析清楚,然后采取办法清除干扰。这是信息论的首要目的。噪声自身是随机的,所以几率论是信息论研究中必不可少的工具。信息论中的滤波困难就是研究在接收信号时如何最大限度地清除噪声的干扰,而编码困难则是研究采取什么样的手段发射信号,能最大限度地抵抗干扰。在空间科学和工业生产的自动化技术中需要用到信息论和控制理论,而研究带随机干扰的控制困难,也要用到几率论方法。
几率论进入其余科学领域的趋势仍在持续发展。值得表示的是,在纯数学领域内用几率论方法研究数论困难已经有很好的结果。在社会科学领域,尤其是经济学中研究最优决策和经济的平稳上涨等困难,也大批采取几率论方法。正如拉普拉斯所说:“生活中最重要的困难,其中绝大部分在实质上导致几率的困难。”
几率论的案例分析
1.基于几率论的围岩分类法
基于几率论的围岩分类法的基本思想是:在确定围岩分类时同期顾虑到几种常用分类法:RQD法,弹性波速vp法和公路隧道设计规范(JTGD70–2004)中采取的BQ值法。各种分类情形见下表。为了简化公式,便于计算,假定这3个不同的划分标准作为随机事件来看是各自独立的,而且这三者在判定中所起的作用也是等同的,所以,依照几率论原理,待判定围岩在3种围岩分类法中获得统一分析结果的几率就是待判定围岩每种分类法几率的乘积。只要分别计算出各种围岩分类标准中每一类围岩显现的几率,其乘积所对应的围岩类别就是该围岩的分类级别。
取RQD值上限为100%,下限为0%;取vp值上限为5km/s,下限为0km/s;取BQ值上限为600,下限为0。各种分类法均看成接连型变量,依照期望值原理,计算各种围岩分类法中每种围岩类别的期望值,结果见下表。
2.各种围岩的几率
依照几率论原理,每一类公路隧道围岩在多种分类方法下获得相同结果的几率如下所述。
(1)Ⅰ类围岩显现的几率为
(7)
(2)Ⅱ类围岩显现的几率为
(8)
(3)Ⅲ类围岩显现的几率为
(9)
(4)Ⅳ类围岩显现的几率为
(10)
(5)Ⅴ类围岩显现的几率为
(11)
(6)Ⅵ类围岩显现的几率为
(12)
3.围岩类别判定
依照几率学原理,在多个事件中,几率最大的事件显现的机会性是最大的。所以通过计算围岩类别的几率,即可确定几率最大的一类即为该待定围岩最有机会的围岩类别,即最有机会的围岩类别为maxPI,PII,PIII,PIV,PV,PVI所对应的围岩类别。
4.算例
为了验证几率论方法在围岩几率分类方面的合理性和科学性,选取云岭隧道中有代表性的2段,利用本文的方法执行计算,其中,一段为软弱围岩,另一段为硬岩。
(1)算例1
桩号里程为K104+800—K104+850,设计围岩类别为Ⅲ类。依据勘察资料可知,该段围岩为弱风化千枚岩,RQD值为0%—30%,属Ⅰ—Ⅱ类围岩,可取RQD值为30%执行计算;弹性波速为2—3km/s,属Ⅲ—Ⅳ类围岩,可取3km/s计算;依照《公路隧道设计规范》(JTGD70–2004)计算得出BQ值为212.5,属Ⅱ类围岩。
用几率论方法计算出来的结果如上表所示。显然,该类岩石为Ⅱ类围岩的几率最大,所以计算分析该类围岩应属Ⅱ类围岩。这与施工过程中遇到的真实围岩情形非常相符。
(2)算例2
桩号里程为K106+850K106+800,设计围岩类别为IV类。依据勘察资料可知,该段为弱—微风化灰岩微风化灰岩RQD值为50%—70%,弱风化灰岩的为20%—50%,为Ⅰ—Ⅲ类围岩,取RQD值为50%执行计算,对应的围岩属Ⅲ类;弹性波速为3.1—4.0km/s,属Ⅳ类围岩,取弹性波速为4km/s计算;依照《公路隧道设计规范》(JTGD70–2004)计算得出BQ值为390,属IV类围岩用几率论方法计算出来的围岩类别如下表所示。显然该类岩石为Ⅳ类围岩的几率最大,所以该类围岩应属Ⅳ类围岩。这与施工过程中遇到的真实的围岩情形非常相符。