学生it检验

✍ dations ◷ 2024-12-22 16:35:16 #学生<i>t</i>检验
学生t检验(英语:Student's t-test)是指虚无假设成立时的任一检定统计有学生t-分布的统计假说检定,属于母数统计。学生t检验常作为检验一群来自正态分配总体的独立样本之期望值的是否为某一实数,或是二(两)群来自正态分配总体的独立样本之期望值的差是否为某一实数。举个简单的例子,也就是说我们可以在抓取一个班级的男生,去比较该班与全校男生之身高差异程度是不是推测的那样,或是不同年级班上的男生身高的差异的场合是否一如预期使用此检验法。学生t检验是威廉·戈塞为了观测酿酒品质于1908年所提出的,“学生”则是他的笔名。 基于克劳德·健力士(Claude Guinness)聘用从牛津大学和剑桥大学出来的最好的毕业生,以将生物化学及统计学应用到健力士工业流程的创新政策,戈斯特受雇于都柏林的健力士酿酒厂担任统计学家。戈斯特提出了t检验以降低啤酒质量监控的成本。戈斯特于1908年在《Biometrika》期刊上公布t检验,但因其老板认为其为商业机密而被迫使用笔名,统计学论文内容也跟酿酒无关。实际上,其他统计学家是知道戈斯特真实身份的。今日,它更常被应用于小样本判断的置信度。最常用t检验的情况有:大多数的t检定之统计量具有t = Z/k的形式,其中Z与k是已知资料的函数。Z通常被设计成对于对立假说有关的形式,而k是一个尺度参数使t服从于t分布。以单样本t检验为例, Z = X ¯ / ( σ / n ) {displaystyle Z={bar {X}}/(sigma /{sqrt {n}})} ,其中 X ¯ {displaystyle {bar {X}}} 为样本平均数, n {displaystyle n} 为样本数, σ {displaystyle sigma } 为总体标准差。至于k在单样本t检验中为 σ ^ / σ {displaystyle {hat {sigma }}/sigma } ,其中 σ ^ {displaystyle {hat {sigma }}} 为样本的标准偏差。在符合零假说的条件下,t检定有以下前提:检验零假说为一群来自正态分配独立样本xi之总体期望值μ为μ0可利用以下统计量其中 i = 1 … n {displaystyle i=1ldots n} , x ¯ = ∑ i = 1 n x i n {displaystyle {overline {x}}={frac {sum _{i=1}^{n}x_{i}}{n}}} 为样本平均数, s = ∑ i = 1 n ( x i − x ¯ ) 2 n − 1 {displaystyle s={sqrt {frac {sum _{i=1}^{n}(x_{i}-{overline {x}})^{2}}{n-1}}}} 为样本标准偏差,n为样本数。该统计量t在零假说:μ = μ0为真的条件下服从自由度为n − 1的t分布。配对样本t检验可视为单样本t检验的扩展,不过检验的对象由一群来自正态分配独立样本更改为二群配对样本之观测值之差。若二群配对样本x1i与x2i之差为di = x1i − x2i独立且来自正态分配,则di之总体期望值μ是否为μ0可利用以下统计量其中 i = 1 … n {displaystyle i=1ldots n} , d ¯ = ∑ i = 1 n d i n {displaystyle {overline {d}}={frac {sum _{i=1}^{n}d_{i}}{n}}} 为配对样本差值之平均数, s d = ∑ i = 1 n ( d i − d ¯ ) 2 n − 1 {displaystyle s_{d}={sqrt {frac {sum _{i=1}^{n}(d_{i}-{overline {d}})^{2}}{n-1}}}} 为配对样本差值之标准偏差,n为配对样本数。该统计量t在零假说:μ = μ0为真的条件下服从自由度为n − 1的t分布。若二群独立样本x1i与x2i具有相同之样本数n,并且彼此独立及来自二个方差相等的正态分配,则二群总体之期望值差μ1 - μ2是否为μ0可利用以下统计量其中 i = 1 … n {displaystyle i=1ldots n} , x ¯ 1 = ( ∑ i = 1 n x 1 i ) / n {displaystyle {overline {x}}_{1}=(sum _{i=1}^{n}x_{1i})/n} 及 x ¯ 2 = ( ∑ i = 1 n x 2 i ) / n {displaystyle {overline {x}}_{2}=(sum _{i=1}^{n}x_{2i})/n} 为二群样本各自的平均数, s p 2 = ( ∑ i = 1 n ( x 1 i − x ¯ 1 ) 2 + ∑ i = 1 n ( x 2 i − x ¯ 2 ) 2 ) / ( 2 n − 2 ) {displaystyle s_{p}^{2}=(sum _{i=1}^{n}(x_{1i}-{overline {x}}_{1})^{2}+sum _{i=1}^{n}(x_{2i}-{overline {x}}_{2})^{2})/(2n-2)} 为样本之共同方差。该统计量t在零假说:μ1 - μ2 = μ0为真的条件下服从自由度为2n − 2的t分布。若二群独立样本x1i与x2j具有不相同之样本数n1与n2,并且彼此独立及来自二个方差相等的正态分配,则二群总体之期望值之差μ1 - μ2是否为μ0可利用以下统计量其中 i = 1 … n 1 {displaystyle i=1ldots n_{1}} ,其中 j = 1 … n 2 {displaystyle j=1ldots n_{2}} , x ¯ 1 = ( ∑ i = 1 n x 1 i ) / n {displaystyle {overline {x}}_{1}=(sum _{i=1}^{n}x_{1i})/n} 及 x ¯ 2 = ( ∑ i = 1 n x 2 i ) / n {displaystyle {overline {x}}_{2}=(sum _{i=1}^{n}x_{2i})/n} 为二群样本各自的平均数, s p 2 = ( ∑ i = 1 n ( x 1 i − x ¯ 1 ) 2 + ∑ j = 1 n ( x 2 j − x ¯ 2 ) 2 ) / ( n 1 + n 2 − 2 ) {displaystyle s_{p}^{2}=(sum _{i=1}^{n}(x_{1i}-{overline {x}}_{1})^{2}+sum _{j=1}^{n}(x_{2j}-{overline {x}}_{2})^{2})/(n_{1}+n_{2}-2)} 为二群样本共同之方差。该统计量t在零假说:μ1 - μ2 = μ0为真的条件下服从自由度为n1 + n2 − 2的t分布。若二群独立样本x1i与x2j具有相等或不相同之样本数n1与n2,并且彼此独立及来自二个方差不相等的正态分配,则二群总体之期望值之差μ1 - μ2是否为μ0可利用以下统计量其中 i = 1 … n 1 {displaystyle i=1ldots n_{1}} ,其中 j = 1 … n 2 {displaystyle j=1ldots n_{2}} , x ¯ 1 = ( ∑ i = 1 n 1 x 1 i ) / n 1 {displaystyle {overline {x}}_{1}=(sum _{i=1}^{n_{1}}x_{1i})/n_{1}} 及 x ¯ 2 = ( ∑ j = 1 n 2 x 2 j ) / n {displaystyle {overline {x}}_{2}=(sum _{j=1}^{n_{2}}x_{2j})/n} 为二群样本各自的平均数, s 1 2 = ( ∑ i = 1 n ( x 1 i − x ¯ 1 ) 2 ) / ( n 1 − 1 ) {displaystyle s_{1}^{2}=(sum _{i=1}^{n}(x_{1i}-{overline {x}}_{1})^{2})/(n_{1}-1)} 及 s 2 2 = ( ∑ j = 1 n ( x 2 j − x ¯ 2 ) 2 ) / ( n 2 − 1 ) {displaystyle s_{2}^{2}=(sum _{j=1}^{n}(x_{2j}-{overline {x}}_{2})^{2})/(n_{2}-1)} 分别为二群样本之方差。该统计量t在零假说:μ1 - μ2 = μ0为真的条件下服从自由度为之t分布。这种方法又常称为Welch检验。在简单线性回归的模型其中xi,i = 1, ..., n为已知,α与β为未知系数,εi为残差独立且服从期望值0且方差σ2未知的正态分布,yi,i = 1, ..., n为观测值。我们可以检验回归系数(在此例即为回归式之斜率)β是否相等于特定的β0(通常使β0 = 0以检验xi对yi是否有关联)。令 α ^ {displaystyle {widehat {alpha }}} 与 β ^ {displaystyle {widehat {beta }}} 为最小二乘法之估计值, S E α ^ {displaystyle SE_{widehat {alpha }}} 与 S E β ^ {displaystyle SE_{widehat {beta }}} 为最小二乘法估计值之标准误差,则在零假设为β = β0的情况下服从自由度为n − 2之t分布,其中由于 ε ^ i = y i − y ^ i = y i − ( α ^ + β ^ x i ) {displaystyle {widehat {varepsilon }}_{i}=y_{i}-{widehat {y}}_{i}=y_{i}-({widehat {alpha }}+{widehat {beta }}x_{i})} 为残差(即估计误差),而 SSR = ∑ i = 1 n ε ^ i 2 {displaystyle {text{SSR}}=sum _{i=1}^{n}{widehat {varepsilon }}_{i}^{;2}} 为残差之离均平方和,我们可改写t为另请参阅:方差齐性检验(F检验)大多数的试算表软件及统计软件,诸如QtiPlot、OpenOffice.org Calc、LibreOffice Calc、Microsoft Excel、SAS、SPSS、Stata、DAP、gretl、R、Python ()、PSPP、Minitab等,都可以进行t检验之运算。

相关

  • 义素义素(英语:Seme)指语义学中可识别的最小意义单位。义位指语义学中能够独立运用的最小意义单位,义位由若干个义素组成。义素与义位的关系类似于音素和音位的关系。类似的“最小概
  • 微米微米(Micrometer、㎛)是长度单位,符号µm。1微米相当于1米的一百万分之一(10-6,此即为“微”的字义)。此外,在ISO 2955的国际标准中,“u”已经被接纳为一个代替“μ”来代表10-6的国
  • 巴斯德研究院巴斯德研究院(法语:Institut Pasteur)总部位于巴黎,是法国的一个私立的非营利研究中心,致力于生物学、微生物学、疾病和疫苗的相关研究,其创建者路易·巴斯德于1885年研发出第一剂
  • 线虫动物线虫动物门(学名:Nematoda)是动物界中最大的门之一,为假体腔动物,绝大多数体小呈圆柱形,又称圆虫(roundworms)。线虫的物种很不容易区分,有相关描述的已超过二万五千种,其中超过一半是
  • 拉萨热拉萨热(Lassa fever)或拉萨出血热(Lassa hemorrhagic fever,LHF)是一种由拉萨病毒(英语:Lassa virus)所引起的病毒性出血热。为生物性危害第四级病毒,大部分被此病毒感染的人不会出现
  • 运输虽然美国在铁路客运方面薄弱,且大都市普遍存在交通堵塞的问题,但美国仍然是世界上交通最为发达的国家之一。17世纪之后,随着殖民地的发达,美国各地的交通网开始逐渐成形。1869年
  • 系统生物系统(Biological system),又称身体系统(Body system)、器官系统(Organ system),是生物的其中一个组成部分,是由许多不同的器官共同组合而成,执行某种特定的生理作用。人体的系统是
  • 联合国系统联合国系统是对联合国及其关联机构的总称,其中部分机构在联合国成立前就已存在。包括:联合国主要基于6个主要组成部分:除了独立的组织外,联合国的各机构还经常下设机构负责专门
  • 腰臀比腰臀比例(Waist–hip ratio WHR)是指腰围和臀围的比例,数值等于腰围除以臀围。严格来说,根据世界卫生组织的数据收集协议,腰围是在末根肋骨与上肠骨中间的水平量度。臀围则是在双
  • 中子毒物中子毒物(英语:Neutron poison)是一种具有大中子吸收截面的物质,由于会对连锁反应造成负面影响,而被称为“毒物”,常应用于反应堆物理计算中。在反应堆中,我们尽可能希望中子由可裂