首页百科经济理论博弈论文章详细

辛普森悖论

外汇网2021-06-19 16:02:48 67

简介

什么是辛普森悖论

辛普森悖论(Simpson'sParadox)亦有人译为辛普森诡论,为英国统计学家E.H.辛普森(E.H.Simpson)于1951年提出的悖论,即在某个条件下的两组报告,分别讨论时全将满足某种性质,可是一旦合并考虑,却或许致使相反的结论。[1]

当民众试图探究两种变量能否具有有关性的时机,比如新生录取率与性别,报酬与性别等,会分别对之执行分组研究。辛普森悖论是在该种研究中,在某些前提下有时会造成的一种现象。即在分组比较中都占优势的一方,会在总评中反而是失势的一方。该现象于20世纪初就有人讨论,但一直到1951年E.H.辛普森在他发表的论文中,该现象才算正式被描述解释。后来就以他的名字命名该悖论。

为了避免辛普森悖论的显现,就需要斟酌个分组的权重,并乘以适当的系数去清除以分组报告基数差异而产生的影响。同期必需了解清楚情形,能否存在潜在原因,综合考虑。

实例

例一:一所美国高校的两个学院,分别是法学院和商学院,新学期招生。民众怀疑这两个学院有性别歧视。现作如下统计:

法学院

性别

录取

拒收

总数

录取比例

男生

8

45

53

15.1%

女生

51

101

152

33.6%

合计

59

146

205

商学院

性别

录取

拒收

总数

录取比例

男生

201

50

251

80.1%

女生

92

9

101

91.1%

合计

293

59

352

依据上面两个表格来说,女生在两个学院都被优先录取。即女生的录取比率较高。当下将两学院的报告总览:

性别

录取

拒收

总数

录取比例

男生

209

95

304

68.8%

女生

143

110

253

56.5%

合计

352

205

557

在总评中,女生的录取比率反而比男生低。

女生单独两个矢量斜率都比男生大,表明它们的比率都比较高。但最后男生总的向量斜率却大于女生,这个例子表明,简单的将分组报告相加总览,是不能反应真实情形的。

此例这就是统计上著名的辛普森悖论(Simpson'sParadox)[1]

前提

就上述例子说,致使辛普森悖论有两个前提。

1、两个分组的录取率相差很大,就是说法学院录取率很低,而商学院却很高。而同期两种性别的申请者分布比重相反。女性申请者的多部分分布在法学院,相反,男性申请者多部分分布于商学院。结果在数量上来看,拒收率高的法学院拒收了很多的女生,男生尽管有更高的拒收率,但被拒收的数量却相对不算多。而录取率很高的商学

2、有潜在原因影响着录取情形。就是说,性别并不是是录取率高低的唯一原因,甚至或许是毫无影响的。至于在学院中显现的比率差,或许是随机事件。又或者是其余原因作用,比如入学成绩,却刚好显现该种录取比例,使人牵强误觉得这是由性别差异而产生的。[1]

回避

辛普森悖论的回避

为了避免辛普森悖论显现,就需要斟酌个别分组的权重,以适当的系数去清除以分组资料基数差异所产生的影响,同期必需了解该情境能否存在其余潜在要因此综合考虑。 [1]

管理

辛普森悖论的管理

辛普森悖论就像是欲比赛100篮球以总胜率评价好坏,于是有人专找大神考验20场而胜1场,此外80场找平手考验而胜40场,结果胜率41%,另一人则专挑大神考验80场而胜8场,而剩下20场平手打个全胜,结果胜率为28%,比41%小很多,但仔细观察考验对象,后者显著较有实力。

量与质是不等价的,无奈的是量比质来得容易量测,所以民众总是习惯用量来评定好坏,而该数据却不是重要的。除了质与量的迷思之外,辛普森悖论的此外一个启示是:假使我们在人生的选择上选择了一条比较难走的路,就得要有机会不被赏识的领悟,所以这算是怀才不遇这个成语在统计上的诠释![1]

标签:

随机快审展示
加入快审,优先展示

加入VIP