首页百科管理管理知识文章详细

分层最佳抽样

外汇网2021-06-22 22:22:14 73
什么是分层最佳抽样

分层最佳抽样又称“非比例抽样”,是依据各层基本单位标准差的大小,来确定各层样本数目的抽样方法。

在各层基本单位之间的差异过分悬殊、某些层的重要性大于其余层的情形下,采取非比例抽样时,在这些层抽取的样本数就多;反之,抽取的样本数就少。假如采取同期兼顾层的大小和层内差异程度的大小来抽样,则有助于提升综合样本对总的全貌的代表性,并可以提升样本的可信程度。

分层最佳抽样的公式

采取分层最佳抽样法,确定各样本数目的计算公式如下:

n_i=nfrac{N_iS_i}{sum N_iS_i}

式中:

ni:第i层应抽出的样本数目;

n:样本总数目;

Ni:第i层的调查单位数;

Si:第i层调查单位的样本标准差。

分层最佳抽样举例

某地有居民20000户,其中高、中、低收入户分别为4000户、12000户、4000户。又已知高收入户的标准差为300元,中收入户的标准差为200元, 低收入户的标准差为100元。现要抽选200户做样本,执行买入力的调查,用分层最佳抽样法分配各层的样本数目。

本题中,已知各层居民收入标准差,即:高收入层(n1)=300、中收入层(n2)=200、低收入层(n3)=100。为了便于计算,见列表:

各层次(不同经济收入) 各层的调查单位数(户)Ni 各层的样本标准差(元)Si 乘积NiSi

低 4000

12000

4000 300

200

100 1200000

2400000

400000

sum N_iS_i 20000 4000000

按公式计算,各层的样本数目为:

高收入层样本数目:S_1=nfrac{N_iS_i}{sum N_iS_i}=200	imesfrac{1200000}{4000000}=60(户)

中收入层样本数目:S_2=nfrac{N_iS_i}{sum N_iS_i}=200	imesfrac{2400000}{4000000}=120(户)

低收入层样本数目:S_3=nfrac{N_iS_i}{sum N_iS_i}=200	imesfrac{400000}{4000000}=20(户)

应用分层最佳抽样方法计算出的各层样本抽取数同分层比例抽样法抽出的样本数对比较,可以看出,因各层标准差大小不同,家庭收入高的分层样本增长了20个(从40个变为60个),家庭收入中等的分层样本数,依然为120个,而家庭收入低的分层样本数降低了20个(从40个变为20个)。高收入户和低收入户在调查总的中单位数均为4000户,为何从高收入户中造成样本数目是60户,从低收入户中造成样本数目只有20户。这是由于,高收入户的标准差大(300元),从中抽取样本数目就要多一部分。低收入户的标准差小(100元),从中抽取的样本数可以少一部分。如此抽选到的综合样本比原本仅考虑分层比例抽样得的综合样本更具有对调查总的的代表性,其抽样调查推断的总的结果精准性程度会有所提。

从理论上表达,各层中的标准差预期值,反应的是各层的单位特质值和各层平均值之间的差异。假如某层中各单位特质值比较靠近,差异较小,那么从理论上表达,标准差就小。所以,少抽取一部分数目的样本,依然可以代表、反应该层的大差不差情形。假如某层内各单位差异较大,那么标准差就较大,因此要适当多选一部分样本才更合理。

标签:

随机快审展示
加入快审,优先展示

加入VIP