正态分布

若连续型随机变量x的概率分布密度函数为

式中μ为平均数,σ2为方差;则称随机变量x服从正态分布(normal distribution), 记为xN(μ,σ2)。

正态分布是一种很重要的连续型随机变量的概率分布,许多统计分析方法都是以正态分布为基础的。此外,还有不少随机变量的概率分布在一定条件下以正态分布为其极限分布。因此在统计学中,正态分布无论在理论研究上还是在实际应用中均占有重要的地位。

t分布

也称学生氏分布,是由W.S.哥赛特在1908年首次提出的,其重要意义在于提供了小样本研究方法。

它的概率分布密度函数如下:

式中:t的取值范围是(-∞,+∞);df=n-1为自由度。

分布: 分布是海尔墨特(Hermert)和卡.皮尔逊(K.Pearson)分别于1875年和1890年导出的。它主要适用于对拟合优度检验和独立性检验,以及对总体方差的估计和检验等。若n个相互独立的随机变量ξ₁、ξ₂、……、ξn ,均服从标准正态分布(也称独立同分布于标准正态分布),则这n个服从标准正态分布的随机变量的平方和构成一新的随机变量,其分布规律称为卡方分布。

F分布

是1924年英国统计学家R.A.Fisher提出,并以其姓氏的第一个字母命名的。设X、Y为两个独立的随机变量,X服从自由度为k1的分布,Y服从自由度为k2的分布,这2 个独立的分布被各自的自由度除以后的比率F。 


正态分布概念是由德国的数学家和天文学家Moivre于1733年首次提出的,但由于德国数学家Gauss率先将其应用于天文学家研究,故正态分布又叫高斯分布,高斯这项工作对后世的影响极大,他使正态分布同时有了“高斯分布”的名称,后世之所以多将最小二乘法的发明权归之于他,也是出于这一工作。但现今德国10马克的印有高斯头像的钞票,其上还印有正态分布的密度曲线。

这传达了一种想法:在高斯的一切科学贡献中,其对人类文明影响最大者,就是这一项。在高斯刚作出这个发现之初,也许人们还只能从其理论的简化上来评价其优越性,其全部影响还不能充分看出来。这要到20世纪正态小样本理论充分发展起来以后。拉普拉斯很快得知高斯的工作,并马上将其与他发现的中心极限定理联系起来,为此,他在即将发表的一篇文章(发表于1810年)上加上了一点补充,指出如若误差可看成许多量的叠加,根据他的中心极限定理,误差理应有高斯分布。这是历史上第一次提到所谓“元误差学说”——误差是由大量的、由种种原因产生的元误差叠加而成。后来到1837年,海根(G.Hagen)在一篇论文中正式提出了这个学说。

在概率论和统计学中,(Student's t-distribution)经常应用在对呈正态分布的总体的均值进行估计。它是对两个样本均值差异进行显着性测试的学生t测定的基础。t检定改进了Z检定,不论样本数量大或小皆可应用。在样本数量大(超过120等)时,可以应用Z检定,但Z检定用在小的样本会产生很大的误差,因此样本很小的情况下得改用学生t检定。在数据有三组以上时,因为误差无法压低,此时可以用变异数分析代替学生t检定。

当母群体的标准差是未知的但却又需要估计时,我们可以运用学生t-分布。

学生t-分布可简称为t分布。其推导由W.S.哥赛特于1908年首先发表,当时他还在都柏林的健力士酿酒厂工作。因为不能以他本人的名义发表,所以论文使用了学生(Student)这一笔名。之后t检验以及相关理论经由罗纳德·费雪的工作发扬光大,而正是他将此分布称为学生分布。

人物——W.S.哥赛特(William Sealy Gosset),英国化学家、数学家与统计学家,以笔名“Student”著名。英国现代统计方法发展的先驱,小样本理论研究的先驱,为研究样本分布理论奠定了重要基础,被统计学家誉为统计推断理论发展史上的里程碑。



数学王子高斯 http://news.xinhuanet.com/world/2010-04/30/c_1265543.htm 

R.A.Fisher  http://www.baike.com/wiki/%E8%B4%B9%E5%B8%8C%E5%B0%94%EF%BC%8CR.A.



小节练习