单原因方差分析(One Way ANOVA)
什么是单原因方差分析
单原因方差分析是指对单原因试验结果执行分析,检验原因对试验结果有无明显性影响的方法。
单原因方差分析是两个样本平均数比较的引伸,它是用来检验多个平均数之间的差异,进而确定原因对试验结果有无明显性影响的一种统计方法。
单原因方差分析有关概念 原因:影响研究对象的某一指标、变量。 水平:原因改变的各种状态或原因改变所分的等级或组别。 单原因试验:考虑的原因只有一个的试验叫单原因试验。 单原因方差分析示例
比如,将抗生素导入人体会造成抗生素与血浆蛋白质结合的现象,以致降低了药效。下表列出了5种常用的抗生素导入到牛的体内时,抗生素与血浆蛋白质结合的百分比。现需要在明显性水平α = 0.05下检验这些百分比的均值有无明显的差异。设各总的服从正态分布,且方差相同。
在这里,试验的指标是抗生素与血浆蛋白质结合的百分比,抗生素为原因,不同的5种抗生素就是这个原因的五个不同的水准。假定除抗生素这一原因外,其余的一切条件都相同。这就是单原因试验。试验的目的是要考察这些抗生素与血浆蛋白质结合的百分比的均值有无明显的差异。即考察抗生素这一原因对这些百分比有无明显影响。这就是一个典型的单原因试验的方差分析困难。
单原因方差分析的基本理论
与一般的统计推断困难一样,方差分析的任务也是先依据事实情形提出原如果H0与备择如果H1,然后寻求适当的检验统计量执行如果检验。本节将借用上面的实例来讨论单原因试验的方差分析困难。
在上例中,原因A(即抗生素)有s(=5)个水平,在每一个水平下执行了nj = 4次独立试验,得到如上表所示的结果。这些结果是一个随机变量。表中的报告可以看成来自s个不同总的(每个水平对应一个总的)的样本值,将各个总的的均值依次记为,则按题意需检验如果
不全相等
为了便于讨论,当下引入总平均μ
其中:
再引入水平Aj的效应δ
显然有,δj表明水平Aj下的总的平均值与总平均的差异。
利用这些记号,本例的如果就等价于如果
不全为零
所以,单原因方差分析的任务就是检验s个总的的均值μj能否相等,也就等价于检验各水平Aj的效应δj能否都等于零。
2. 检验所需的统计量
如果各总的服从正态分布,且方差相同,即假定各个水平下的样本来自正态总的N(μj,σ2),μj与σ2未知,且设不同水平Aj下的样本之间相互独立,则单原因方差分析所需的检验统计量可以从总平方和的分解导出来。下面先引入:
水平Aj下的样本平均值:
报告的总平均:
总平方和:
ST = SE + SA总平方和ST反应了全部试验报告之间的差异,所以ST又称为总变差。将其分解为
其中:
上述SE的各类表明了在水平Aj下,样本观察值与样本均值的差异,这是由随机误差所引起的,所以SE叫做误差平方和。SA的各类表明了在水平Aj下的样本平均值与报告总平均的差异,这是由水平Aj以及随机误差所引起的,所以SA叫做原因A的效应平方和。
可以证明SA与SE相互独立,且当为真时,SA与SE分别服从自由度为s − 1,n − 2的x2分布,即
SA / σ2˜x2(s − 1)
SE / σ2˜x2(n − s)
于是,当为真时
这就是单原因方差分析所需的服从F分布的检验统计量。
3. 如果检验的婉拒域
通过上面的分析可得,在明显性水平α下,本检验困难的婉拒域为
为了方便分析比较,一般将上述分析结果编排成如下表所示的方差分析表。表中的分别称为SS的均方。