一、平均指标指数

1.定义:是从总体的两个总平均水平的对比中得到反映其变动程度和方向的相对数。

2.特点:

第一,它是利用分组资料计算的指数。它所测定的总体平均指标是对组平均数的加权平均,其权数是各组单位数占总体单位总数的比重。

第二,平均指标指数除了一般的测定总体平均指标变动程度之外,还可以测定总体内部各组水平的平均变动和总体结构变动对总平均指标变动的影响。

3.形式:

可变构成指数   固定结构指数   结构影响指数 
















为了了解企业的平均工资水平的变动情况,收集了以下数据。试计算平均工资指数的变动程度和绝对金额,以及分析工人数和月平均工资变动对其产生的影响。

1   某企业工人工资水平统计















计算结果显示,平均工资可变构成指数为99.43%,报告期平均工资比基期下降了0.57%,减少了28.6元。其中,纯粹由于月工资水平的变动而使该企业总平均工资增长11.18%,增加500元;纯粹由于工人人数结构调整而使该企业总平均工资下降了10.51%,减少了528.6元。

请思考:明明技术工人和辅助工人组的工资都有不同程度的提高,但为什么总平均工资却下降了呢?




辛普森悖论

辛普森悖论(Simpson's Paradox)亦有人译为辛普森诡论,为英国统计学家E.H.辛普森(Edward H. Simpson)于1951年提出的悖论,即在某个条件下的两组数据,分别讨论时都会满足某种性质,可是一旦合并考虑,却可能导致相反的结论。

当人们尝试探究两种变量是否具有相关性的时候,比如新生录取率与性别,报酬与性别等,会分别对之进行分组研究。辛普森悖论是在这种研究中,在某些前提下有时会产生的一种现象。即在分组比较中都占优势的一方,会在总评中反而是失势的一方。该现象于20世纪初就有人讨论,但一直到1951年E.H.辛普森在他发表的论文中,该现象才算正式被描述解释。后来就以他的名字命名该悖论。

为了避免辛普森悖论的出现,就需要斟酌各分组的权重,并乘以一定的系数去消除以分组数据基数差异而造成的影响。同时必需了解清楚情况,是否存在潜在因素,综合考虑。

【实例】(以下内容取材自维基百科与科普写作奖佳作奖作者林守德的向理性与直觉挑战的顽皮精灵-综观诡谲的悖论等文)

“校长,不好了,有很多男生在校门口抗议,他们说今年研究所女生录取率42%是男生21%的两倍,我们学校遴选学生有性别歧视”,校长满脸疑惑的问秘书:“我不是特别交代,今年要尽量提升男生录取率以免落人口实吗?”

秘书赶紧回答说:“确实有交代下去,我刚刚也查过,的确是有注意到,今年法学院录取率是男性75%,女性只有49%;而商学院录取率是男性10%,女性为5%。二个学院都是男生录取率比较高,校长这是我作的调查报告。”


“秘书,你知道为什么个别录取率男皆大于女,但是总体录取率男却远小于女吗?”

此例这就是统计上著名的辛普森悖论(Simpson's Paradox)

【解释】上面例子说明,简单的将分组资料相加汇总,是不一定能反映真实情况的。就上述例子录取率与性别来说,导致辛普森悖论有两个前提。

(1) 两个分组的录取率相差很大,就是说法学院录取率9.2%很低,而商学院53.3%却很高,另一方面,两种性别的申请者分布比重却相反,女生偏爱申请商学院,故商学院女生申请比率占83.3%,相反男生偏爱申请法学院,因此法学院女生申请比率只占0.833%。结果在数量上来说,录取率低的法学院,因为女生申请为数少,所以不录取的女生相对很少。而录取率很高的商学院虽然录取了很多男生,但是申请者却不多。使得最后汇总的时候,女生在数量上反而占优势。

(2) 性别并非是录取率高低的唯一因素,甚至可能是毫无影响的,至于在法商学院中出现的比率差可能是属于随机事件,又或者是其他因素作用,譬如学生入学成绩却刚好出现这种录取比例,使人牵强地误认为这是由性别差异而造成的。



[1]辛普森悖论:诡异的男女比例 [EB/OL].[2011-11-03]. http://www.guokr.com/article/6222/.

[2]数据分析一定要避免辛普森悖论[EB/OL].[2014-06-25]. http://www.36dsj.com/archives/9340.



小节练习