全及总体

简称总体,是被研究事物或现象的全体,它由调查对象所有单位组成。全及总体单位数用N表示。

样本总体

简称样本,是指在全及总体中按照随机原则抽出来的那部分单位数所组成的小总体,用n表示。

总体参数

根据全及总体各单位变量值计算的反映全及总体某数量特征的综合指标。

样本统计量

根据样本总体各单位变量值计算的反映样本总体某数量特征的综合指标,由于样本总体不具唯一性,样本统计量是一个随机变量。

重置 ()抽样

有放回抽样,抽样安排为对每次被抽到的单位经登记后再放回总体,重新参与下一次抽选的抽样方法。在每次的抽取中样本单位被抽中的概率都等于1/N

不重置()抽样

不放回抽样,抽样安排为对被抽到的单位登记后不再放回总体的抽样方法。不重复抽样与重复抽样比较,每次抽样的条件是不同的,前一次的抽取结果会对后一次的抽取产生影响,

简单随机抽样

也称单纯随机抽样,它是指从总体的所有单位中按照随机原则抽取样本单位的方式。对于总体中每个单位,被抽取的机会都是相等的。




抽样调查的发展历史

关于抽样调查的发展历史,可分三个不同的时间段进行考察。

1.1895年以前。抽样调查处在实践探索过程和萌芽阶段。

原始的抽样法,在人类活动中早就使用过,如古代中国人、古希腊人就知道从整体中取出一小部分予以观察和检验,以确定物体的性质。

其后,政治算术学派的学者们在研究中广泛采用样本资料进行总体推算。格朗特(John Graunt)以伦敦市的人口为基础,研究人口现象运动的规律。

法国经济学家麦桑斯、摩休,英国经济学家伊顿,法国的数学家、统计学家拉普拉斯(丹麦统计学家韦斯特加德(H.L.Westergaard)认为:“现代代表统计学就是以选择出的部分资料(样本)为基础,而推导出全部资料的计算结果(抽样法)。”)

著名统计学家、比利时的凯特勒研究了写作与年龄的关系,所使用的研究方法实际上就是抽样方法。俄国数学家奥斯特罗格拉茨基院士主张在产品质量检验中用抽样法。

在抽样调查发展史上,挪威的凯尔(Anders Niscolai Kiaer)是一个划时代的人物。他对抽样调查的贡献,无论是在实践还是在理论方面,就当时的条件而言,都是十分卓越的。因此,马来西亚统计学家尤葆生(You Poh Seng)在《抽样理论与实践发展的历史的考察》一文中评价到:“凯尔的工作,可以视为统计学史上的一个转折点。他是离开人口普查而用抽样方法搜集社会资料的第一人,并为抽样理论奠定了基础。”

大量事实表明,在1895年以前,抽样调查的实践应用已经在许多领域展开,这些都为抽样调查的进一步发展创造了条件,积累了宝贵经验。但这时的抽样调查仍处于探索过程之中,没有形成系统的理论,也没有得到普遍的认可。

2.1895~1925年。抽样调查逐步得以确认的过程。

凯尔在坚持抽样调查实践的同时,还十分注意对抽样调查的方法和理论进行研究。总结实践经验,他认为,一次成功的抽样调查应具备两个条件,即正确的代表性和单位的合理选择。因为“调查结果的准确性,不取决于观察数量的多寡,而取决于取得正确代表性的方法。”

1895年,国际统计学会(ISI)在瑞士首都伯尔尼召开第五次大会。会上,凯尔提出关于代表性调查的报告——《对代表性调查的研究和经验》,

1897年,在俄国圣·彼得堡召开的第六届国际统计学会大会上,凯尔又作了长篇发言,全面阐述了代表性调查的思想,为代表性调查进行辩解。国际统计学会仍未能采纳凯尔的主张。但同意组成一个小组委员会专门讨论这一问题。

1899年的国际统计学大会上,凯尔发表了《论代表性和类型方法》的报告,同时又在《统计文汇》发表《论代表性调查》的论文,并重申了他在国际统计学会的主张。

1901年,国际统计学会第八届大会在匈牙利布达佩斯召开,在会上凯尔发表《再论代表性和类型方法》的论文,继续宣讲代表性调查的意义。同时,由于德国的博尔基威茨“论检查的方法”的发表,指出对代表性可以进行检验,从而为抽样误差的计算奠定了基础,也为凯尔的论据增加了说服力。

1903年,在柏林召开的第九届国际统计学会上,凯尔的愿望终于实现了。研究代表性方法的小组委员会“建议采用代表性方法。

1910年,英国的鲍利在其所著《统计学基础教程》一书中,首次增加“抽样法”一章,介绍了抽样方法在商业、矿业和工业中的应用。

1923年,英国的R·A·费暄首次提出“方差分析”,并认为用这种方法可以估计抽样误差。为保证误差估计值的有效性,还引入了“随机化”原则。从此,使抽样调查理论向前跨进了重要的一步。

1924年,国际统计学会常设理事会指定由英国的鲍利等六人组成研究委员会,进一步研究代表性方法在统计中的应用问题。1925年在罗马的第十六届大会上,该委员会提出报告,肯定了随机抽样的科学性,同时还发表了两篇研究论文:詹森的《代表性方法的实践》;鲍利的《抽样精确度的测定》,阐述了抽样法的原理。

1895年到1925年,经过30年的反复讨论,代表性方法,即抽样方法,才得到人们的最终承认。在这一过程中,凯尔以其坚持不懈的努力,被称为抽样调查的先驱者是当之无愧的。而鲍利则从抽样理论上有力地支持了代表性调查的主张,从而对抽样调查的初步发展作出了贡献。

在抽样调查的理论得以逐步公认的同时,抽样的实践活动继续得以深入发展。

3.1925年以后。抽样调查进入全面发展阶段、逐步走向成熟。

在实践方面继续大量采用抽样调查的同时,在理论方面,1925年费暄发表《研究人员用统计方法》,标志着由戈塞特开始的“小样本理论”(又叫“学生分布”)最后得以完成。从而使统计学由“描述”向“推断”发展。小样本的思想是:应该从小处着手,只要精心设计小样本,用实验与推断的方法便可得到精确的结论。同时,由于费暄的努力,使1900年英国的皮尔逊提出的“卡方检验法”也能适用于小样本。1938年,费暄又同耶茨(F.Yates)合编“F分布显著性水平表”,为t分布和F分布的研究和应用提供了便利。

1927年,蒂皮特按费暄的随机化原则制作发表了《随机数字表》,使随机抽样便于进行。

1927~1929年英国生物统计学家克拉汉与威沙特发表《利用抽样方法估计各类产量》和《抽样技术的研究》等论文,运用方差分析方法计算各种类型的抽样单位所具有的抽样误差。

接着,卡弗(Carver)于1930年把组合分析理论应用到抽样误差的估计上来,促进了抽样理论的发展。他认为,借助于这一新理论可将任何抽样方式或设计的误差估计值计算出来。

1934年,内曼发表“论代表性方法的两个不同方面”的论文,从理论上分析批判了目的抽样法,并为分层抽样和整群抽样奠定了基础。

1935年,费暄的《实验设计》一书出版,提出了著名的实验设计原理,以及他的方差分析技术与卡弗提出的组合分析技术的结合,使抽样理论的总的轮廓基本确定。

1940~1950年间,内曼又提出“区间估计理论”亦称“置信区间估计理论”,为抽样推断的发展做出了重要贡献。

在抽样调查的实践和理论两方面都有建树的人物之中,印度统计学家马哈拉诺比斯的贡献是值得重视的。他认识到:在统计调查中同时考虑到抽样误差和非抽样误差是必要的;应用了许多现在已普遍使用的方法,如单纯随机抽样、系统抽样、分层抽样、集体抽样、两阶抽样、多阶抽样等;提出了关于区域或网格抽样方法的理论,并进一步介绍“费用函数”、“方差函数”的概念,用以根据不同情况进行抽样观察时作最合理、最经济的设计;还提出探测式的抽样方法;用“交叉子样本的抽样方法”计算抽样方差。

联合国统计局在设计抽样方法和推广抽样调查方面作出了巨大的努力和贡献。1947年,联合国专门设立“统计委员会统计抽样分会”,由马哈拉诺比斯任主席,推动各国开展抽样调查。1960年出版《统计抽样方法简要手册》第一卷《抽样调查理论基础》,向世界各国政府推荐了行之有效的22种社会经济的抽样方法。1972年,在总结各国经验的基础上,修订了《抽样调查理论基础》一书,推荐的抽样方法由22种增加到32种,并出版《统计抽样方法简要手册》第二卷《抽样设计的计算机程序》。进入20世纪80年代,联合国统计局又开始在世界各地成立统计研修所,培养大批统计人才,促进联合国抽样方法的实施,协助发展中国家采用多主题抽样方法等,都取得了显著的成就。

从历史发展过程看,抽样调查在国外被广泛应用于社会问题、经济问题、民意测验以及自然科学等各种领域,已成为搜集统计资料的最主要的方法之一。



段海波,抽样调查简史[M],天津财经大学硕士学位论文,2013。

杨清,抽样调查史上群星灿烂[J],1996(5),市场研究。

金勇进,方开泰编,抽样调查[M],高等教育出版社,2005


小节练习