简述
point estimation
由样本报告预期总的分布所含未知参数的真值,所得到的值,称为预期值。点预期的精确程度用置信区间表明。
当母群的性质不清楚时,我们须利用某一量数作为预期数,以帮助了解母数的性质.如:样本平均数乃是母群平均数μ的预期数.当我们只用一个特定的值,亦即数线上的一个点,作为预期值以预期母数时,就叫做点预期.
点预期目的是根据样本X=(X1,X2,…,Xn)预期总的分布所含的未知参数θ或θ的函数 g(θ)。一般θ或g(θ)是总的的某个特质值,如数学期望、方差、有关系数等。
点预期的常用方法有矩预期法、顺序统计量法、最大似然法、最小二乘法等。正文
参数预期的一种形式。目的是根据样本
X=(
X1,
X2,…,
Xn)预期总的分布所含的未知参数
θ或
θ的函数
g(
θ)。一般
θ或
g(
θ)是总的的某个特质值,如数学期望、方差、有关系数(见有关分析)等。
θ或
g(
θ)一般取实数或
k维实向量为值。点预期困难就是要构造一个只依靠于样本
X的量抭(
X),作为
g(
θ)的预期值。抭(
X)称为
g(
θ)的预期量。由于
k维实向量可表为
k维欧几里得空间的一个点,故称如此的预期为点预期。
比如,设一批产品的废品率为
θ,为预期
θ,从这批产品中随机地抽出
n个作检查,以
X 记其中的废品个数,用
X/
n预期
θ,就是一个点预期。又如用样本方差(见统计量)预期总的分布的方差,或用样本有关系数预期总的分布的有关系数,均为常见的点预期。构造点预期的方法
矩预期法
这是英国统计学家К.皮尔森在1894年提出的方法,其要旨是用样本矩的函数预期总的矩的同一函数。比如,若总的分布服从正态分布 N(μ,σ2),其中μ是总的均值,σ2是总的方差,未知参数可记为θ=(μ,σ)。σ/μ(μ≠0)称为变异系数,它是总的的一阶原点矩(即均值)μ与二阶中心矩(即方差)σ2的函数。设有样本X=(X1,X2,…,Xn),其一阶样本原点矩为,二阶样本中心矩为,而用预期 σ/μ,就是一个典型的矩预期方法。
最大似然预期法
此法作为一种重要而广泛的点预期法,由英国统计学家R.A.费希尔在1912年提出。后来在他1921年和1925年的工作中又加以发展。设样本X=(X1,X2,…,Xn)的分布密度为L(X,θ),若固定X而将L看为θ的函数,则称为似然函数,当X是简单随机样本时,它等于ƒ(X1,θ)ƒ(X2,θ)…ƒ(Xn,θ),其中,ƒ(X,θ)是总的分布的密度函数或几率函数(见几率分布)。一经得到样本值x,就确定(x),使 ,然后用预期g(θ),这就是g(θ)的最大似然预期。比如,不难证明,前面为预期正态分布N(μ,σ2)中的参数μ和σ2而提出的预期量和2,就是μ和σ2的最大似然预期。
最小二乘预期法
这个重要的预期方法是由德国数学家C.F.高斯在1799~1809年和法国数学家A.-M.勒让德在1806年提出,并由俄国数学家Α.Α.马尔可夫在1900年加以发展。它首要用于线性统计模型中的参数预期困难。 贝叶斯预期法 是基于“贝叶斯学派”的看法而提出的预期法(见贝叶斯统计)。
小样本优良性准则
可以用来预期g(θ)的预期量很多,于是造成了怎样选择一个优良预期量的困难。首先务必对“优良性”定出准则。该种准则不是惟一的,它可以依据困难的事实背景和理论上的方便执行选择。优良性准则有两大类:一类是小样本准则,即在样本大小固定时的优良性准则;另一类是大样本准则,即在样本大小趋于无穷时的优良性准则。最重要的小样本优良性准则是无偏性及与此有关的统一最小方差无偏预期。若一个预期量抭(X)的数学期望等于被预期的g(θ),即对一切θ,,则称抭(X)为g(θ)的无偏预期,该种预期的特点是:在多次重复用时, 抭(X)与g(θ)的偏差的算术平均值随运用次数的增长而趋于零。所以,无偏性只在重复运用中,而且各次误差能相互抵消时,才显出其意义。无偏预期并没有总是存在。比如,设总的服从二项分布B(n,θ),0<θ<1,则1/θ的无偏预期就不存在。有时,无偏预期尽管存在,但很不合理。在一部分困难中,无偏预期有很多,它们的优良性由其方差来衡量,方差愈小愈好。若一无偏预期的方差比任何别的无偏预期的方差都小,或至多相等,则称它为统一最小方差无偏预期。寻求统一最小方差无偏预期的一个广泛方法,是D.布莱克韦尔、E.L.莱曼和H.谢菲在1950年提出的,它基于统计量的充分性与完全性的概念:设抭(X)是一个无偏预期,T是一个完全充分统计量,则抭(X)在给定T时的条件期望就是一个统一最小方差无偏预期。 克拉默-拉奥不等式是谋求统一最小方差无偏预期的另一重要工具,是由印度统计学家C.R.拉奥和瑞典统计学家H.克拉默在1945年和1946年先后独立地证明的。当样本的似然函数 L(X,θ)满足一定条件时,则 g(θ)的任一无偏预期 抭(X)的方差 ,对于一切θ满足不等式这个不等式的右边只与样本的分布及待估函数 g相关,而与抭(X)无关。一般称这个不等式为克拉默-拉奥不等式,或C-R不等式。它的右边给出了 g(θ)的无偏预期的方差的最小下界,称为克拉默-拉奥下界或C-R下界。所以,若某一无偏预期的方差高达上述C-R下界,则它必是统一最小方差无偏预期。C-R不等式在其余统计困难中也有应用。在点预期困难中还运用其余一部分小样本准则,如容许性准则、最小化最大准则、最优同变准则(见统计决策理论)等。大样本优良性准则
重要的如下
相合性 若g(θ)的预期量 抭n(X1,X2,…,Xn)在n趋于无穷时,在某种收敛意义下(见几率论中的收敛)收敛于g(θ),则称抭n(X1,…,Xn)是 g(θ)的在该种收敛意义下的相合预期。这是点预期最基本的大样本准则。比如依几率收敛意义下的相合性称为弱相合,差不多必然收敛意义下的相合性称为强相合。矩预期一般具有相合性。最大似然预期在一定条件下为强相合的证明始自A.瓦尔德1949年的工作,并在以后为很多学者所发展。线性统计模型中参数的最小二乘预期的强相合性研究始于20世纪60年代,近年来获得很大的进度。
最优渐近正态预期
简称BAN预期。设X1,X2,…,Xn为从一总的中随机独立地抽出的样本,总的分布具有密度函数或几率函数 ƒ(x,θ),满足适当的正则条件,设g(θ)为待估函数,记 式中说为费希尔信息量,若g(θ)的预期量为抭n(X1,X2,…,Xn),当n→时,依分布收敛于正态分布 N(0,v2(θ)),就称此预期量为g(θ)的 BAN预期。在g(θ)的一类渐近正态预期中,以该种预期的渐近方差最小,故称为最优渐近正态预期。在一般条件下,最大似然预期是BAN预期。
渐近有效预期
当样本大小为n时,C-R不等式的右边(即C-R下界)就是 v2(θ)/n。在BAN预期定义中,仍未要求预期量抭n(X1,X2,…,Xn)的方差存在,假使去掉渐近正态性的要求,而要求抭n(X1,X2,…,Xn)的方差存在且渐近于C-R下界,则得到克拉默于1946年定义的渐近有效预期的概念。不少情形下,BAN预期也是渐近有效预期。1960年印度统计学家R.R.巴哈杜尔提出其他渐近有效性的概念,还可以用于如果检验困难。近年来,日本统计学家竹内启又在两个方面发展了预期的渐近有效性概念:一是渐近分布不必是正态分布;二是收敛于渐近分布的阶不必是。 点预期理论是数理统计学得到较多和较深入发展的一个方面。在小样本方面,1955年C.施坦提出了一个反例,证明当维数大于2时,多维正态分布均值向量的一般预期(样本均值)在平方损失下不可容许。这个简单的但出乎意料的反例启发了有关点预期的容许性的一连串研究。在大样本方面,值得提及的成长仍有自适应预期、稳健预期及非参数预期方面很多深入的结果。
参考书目
H.克拉默著,魏宗舒等译:《统计学数学方法》,上海科学技术出版社,上海,1966。(H.Cramér,MatheMatical Methods of Statistics,Princeton Univ. Press,Princeton, 1946.) 成平等著:《参数预期》,上海科学技术出版社,上海,1985。