学生t检验

✍ dations ◷ 2025-04-04 19:37:42 #学生t检验
学生t检验(英语:Student's t-test)是指虚无假设成立时的任一检定统计有学生t-分布的统计假说检定,属于母数统计。学生t检验常作为检验一群来自正态分配总体的独立样本之期望值的是否为某一实数,或是二(两)群来自正态分配总体的独立样本之期望值的差是否为某一实数。举个简单的例子,也就是说我们可以在抓取一个班级的男生,去比较该班与全校男生之身高差异程度是不是推测的那样,或是不同年级班上的男生身高的差异的场合是否一如预期使用此检验法。学生t检验是威廉·戈塞为了观测酿酒品质于1908年所提出的,“学生”则是他的笔名。 基于克劳德·健力士(Claude Guinness)聘用从牛津大学和剑桥大学出来的最好的毕业生,以将生物化学及统计学应用到健力士工业流程的创新政策,戈斯特受雇于都柏林的健力士酿酒厂担任统计学家。戈斯特提出了t检验以降低啤酒质量监控的成本。戈斯特于1908年在《Biometrika》期刊上公布t检验,但因其老板认为其为商业机密而被迫使用笔名,统计学论文内容也跟酿酒无关。实际上,其他统计学家是知道戈斯特真实身份的。今日,它更常被应用于小样本判断的置信度。最常用t检验的情况有:大多数的t检定之统计量具有t = Z/k的形式,其中Z与k是已知资料的函数。Z通常被设计成对于对立假说有关的形式,而k是一个尺度参数使t服从于t分布。以单样本t检验为例, Z = X ¯ / ( σ / n ) {displaystyle Z={bar {X}}/(sigma /{sqrt {n}})} ,其中 X ¯ {displaystyle {bar {X}}} 为样本平均数, n {displaystyle n} 为样本数, σ {displaystyle sigma } 为总体标准差。至于k在单样本t检验中为 σ ^ / σ {displaystyle {hat {sigma }}/sigma } ,其中 σ ^ {displaystyle {hat {sigma }}} 为样本的标准偏差。在符合零假说的条件下,t检定有以下前提:检验零假说为一群来自正态分配独立样本xi之总体期望值μ为μ0可利用以下统计量其中 i = 1 … n {displaystyle i=1ldots n} , x ¯ = ∑ i = 1 n x i n {displaystyle {overline {x}}={frac {sum _{i=1}^{n}x_{i}}{n}}} 为样本平均数, s = ∑ i = 1 n ( x i − x ¯ ) 2 n − 1 {displaystyle s={sqrt {frac {sum _{i=1}^{n}(x_{i}-{overline {x}})^{2}}{n-1}}}} 为样本标准偏差,n为样本数。该统计量t在零假说:μ = μ0为真的条件下服从自由度为n − 1的t分布。配对样本t检验可视为单样本t检验的扩展,不过检验的对象由一群来自正态分配独立样本更改为二群配对样本之观测值之差。若二群配对样本x1i与x2i之差为di = x1i − x2i独立且来自正态分配,则di之总体期望值μ是否为μ0可利用以下统计量其中 i = 1 … n {displaystyle i=1ldots n} , d ¯ = ∑ i = 1 n d i n {displaystyle {overline {d}}={frac {sum _{i=1}^{n}d_{i}}{n}}} 为配对样本差值之平均数, s d = ∑ i = 1 n ( d i − d ¯ ) 2 n − 1 {displaystyle s_{d}={sqrt {frac {sum _{i=1}^{n}(d_{i}-{overline {d}})^{2}}{n-1}}}} 为配对样本差值之标准偏差,n为配对样本数。该统计量t在零假说:μ = μ0为真的条件下服从自由度为n − 1的t分布。若二群独立样本x1i与x2i具有相同之样本数n,并且彼此独立及来自二个方差相等的正态分配,则二群总体之期望值差μ1 - μ2是否为μ0可利用以下统计量其中 i = 1 … n {displaystyle i=1ldots n} , x ¯ 1 = ( ∑ i = 1 n x 1 i ) / n {displaystyle {overline {x}}_{1}=(sum _{i=1}^{n}x_{1i})/n} 及 x ¯ 2 = ( ∑ i = 1 n x 2 i ) / n {displaystyle {overline {x}}_{2}=(sum _{i=1}^{n}x_{2i})/n} 为二群样本各自的平均数, s p 2 = ( ∑ i = 1 n ( x 1 i − x ¯ 1 ) 2 + ∑ i = 1 n ( x 2 i − x ¯ 2 ) 2 ) / ( 2 n − 2 ) {displaystyle s_{p}^{2}=(sum _{i=1}^{n}(x_{1i}-{overline {x}}_{1})^{2}+sum _{i=1}^{n}(x_{2i}-{overline {x}}_{2})^{2})/(2n-2)} 为样本之共同方差。该统计量t在零假说:μ1 - μ2 = μ0为真的条件下服从自由度为2n − 2的t分布。若二群独立样本x1i与x2j具有不相同之样本数n1与n2,并且彼此独立及来自二个方差相等的正态分配,则二群总体之期望值之差μ1 - μ2是否为μ0可利用以下统计量其中 i = 1 … n 1 {displaystyle i=1ldots n_{1}} ,其中 j = 1 … n 2 {displaystyle j=1ldots n_{2}} , x ¯ 1 = ( ∑ i = 1 n x 1 i ) / n {displaystyle {overline {x}}_{1}=(sum _{i=1}^{n}x_{1i})/n} 及 x ¯ 2 = ( ∑ i = 1 n x 2 i ) / n {displaystyle {overline {x}}_{2}=(sum _{i=1}^{n}x_{2i})/n} 为二群样本各自的平均数, s p 2 = ( ∑ i = 1 n ( x 1 i − x ¯ 1 ) 2 + ∑ j = 1 n ( x 2 j − x ¯ 2 ) 2 ) / ( n 1 + n 2 − 2 ) {displaystyle s_{p}^{2}=(sum _{i=1}^{n}(x_{1i}-{overline {x}}_{1})^{2}+sum _{j=1}^{n}(x_{2j}-{overline {x}}_{2})^{2})/(n_{1}+n_{2}-2)} 为二群样本共同之方差。该统计量t在零假说:μ1 - μ2 = μ0为真的条件下服从自由度为n1 + n2 − 2的t分布。若二群独立样本x1i与x2j具有相等或不相同之样本数n1与n2,并且彼此独立及来自二个方差不相等的正态分配,则二群总体之期望值之差μ1 - μ2是否为μ0可利用以下统计量其中 i = 1 … n 1 {displaystyle i=1ldots n_{1}} ,其中 j = 1 … n 2 {displaystyle j=1ldots n_{2}} , x ¯ 1 = ( ∑ i = 1 n 1 x 1 i ) / n 1 {displaystyle {overline {x}}_{1}=(sum _{i=1}^{n_{1}}x_{1i})/n_{1}} 及 x ¯ 2 = ( ∑ j = 1 n 2 x 2 j ) / n {displaystyle {overline {x}}_{2}=(sum _{j=1}^{n_{2}}x_{2j})/n} 为二群样本各自的平均数, s 1 2 = ( ∑ i = 1 n ( x 1 i − x ¯ 1 ) 2 ) / ( n 1 − 1 ) {displaystyle s_{1}^{2}=(sum _{i=1}^{n}(x_{1i}-{overline {x}}_{1})^{2})/(n_{1}-1)} 及 s 2 2 = ( ∑ j = 1 n ( x 2 j − x ¯ 2 ) 2 ) / ( n 2 − 1 ) {displaystyle s_{2}^{2}=(sum _{j=1}^{n}(x_{2j}-{overline {x}}_{2})^{2})/(n_{2}-1)} 分别为二群样本之方差。该统计量t在零假说:μ1 - μ2 = μ0为真的条件下服从自由度为之t分布。这种方法又常称为Welch检验。在简单线性回归的模型其中xi,i = 1, ..., n为已知,α与β为未知系数,εi为残差独立且服从期望值0且方差σ2未知的正态分布,yi,i = 1, ..., n为观测值。我们可以检验回归系数(在此例即为回归式之斜率)β是否相等于特定的β0(通常使β0 = 0以检验xi对yi是否有关联)。令 α ^ {displaystyle {widehat {alpha }}} 与 β ^ {displaystyle {widehat {beta }}} 为最小二乘法之估计值, S E α ^ {displaystyle SE_{widehat {alpha }}} 与 S E β ^ {displaystyle SE_{widehat {beta }}} 为最小二乘法估计值之标准误差,则在零假设为β = β0的情况下服从自由度为n − 2之t分布,其中由于 ε ^ i = y i − y ^ i = y i − ( α ^ + β ^ x i ) {displaystyle {widehat {varepsilon }}_{i}=y_{i}-{widehat {y}}_{i}=y_{i}-({widehat {alpha }}+{widehat {beta }}x_{i})} 为残差(即估计误差),而 SSR = ∑ i = 1 n ε ^ i 2 {displaystyle {text{SSR}}=sum _{i=1}^{n}{widehat {varepsilon }}_{i}^{;2}} 为残差之离均平方和,我们可改写t为另请参阅:方差齐性检验(F检验)大多数的试算表软件及统计软件,诸如QtiPlot、OpenOffice.org Calc、LibreOffice Calc、Microsoft Excel、SAS、SPSS、Stata、DAP、gretl、R、Python ()、PSPP、Minitab等,都可以进行t检验之运算。

相关

  • 极地气候寒带分为南寒带,北寒带。南寒带是南极圈(南纬66.5度)以内的区域,北寒带是北极圈(北纬66.5度)以内区域。在南寒带,南极洲大陆完全被冰覆盖,四周受到极地东风带的强劲吹拂。南寒带气候
  • 夫夫夫夫(英语:gay couple)是指在同性婚姻合法的地区或国家,男性和男性经过一定仪式(婚礼)或法律程序确立婚姻后的关系。一般会共同生活、维持经济、一同养育子女等。夫夫双方互为对方
  • 电子设备电子学(英语:Electronics),是用包括有源电子元器件(例如真空管、二极管、三极管、集成电路)和与之相关的无源器件等电子组件来构成电路的互连技术。有源器件的非线性特性和控制电
  • 埃迪卡拉纪埃迪卡拉纪(英语:Ediacaran),又称艾迪卡拉纪、震旦纪、文德纪,是元古宙最后的一段时期。一般指6.35-5.41亿年前。学者曾用这个名字指称不同阶段,直到2004年5月13日,国际地质科学联
  • 长岛长岛(英语:Long Island)是位于北美洲大西洋岸的岛屿,行政上隶属美国纽约州;长190公里,宽约20-30公里,从纽约港伸入北大西洋;向北,隔长岛海湾与康涅狄格州、罗德岛州相望;向南是北大西
  • 拉贝洛尔拉贝洛尔 (Normodyne, Trandate, 复方二氢氯噻: Normozyde) 是一种甲型肾上腺受体阻断剂和乙型肾上腺受体阻滞剂,用于治疗高血压。原理是阻断肾上腺素受体,放缓窦性心律,减少外
  • 王光谦王光谦(1962年-),河南镇平人,清华大学土木水利学院水利水电工程系博士生导师,华东师范大学河口海岸学国家重点实验室学术委员会主任。现任青海大学校长。1978年至1982年,求学于武汉
  • 伊里奥特弗三世因提夫三世(Intef III)古埃及古王国时期第十一王朝的国王。作为儿子继承了父王的王位。他保卫了领土,维持了和平。
  • 拘捕逮捕指以强制力拘束人身自由之强制处分,逮捕之主要目的为预防犯罪或是为进行侦查。逮捕,是指为了防止犯罪嫌疑人或者被告人实施妨碍刑事诉讼的行为,逃避侦查、起诉、审判或者发
  • 泛日耳曼主义泛日耳曼主义是19世纪于德国流行的一种泛民族主义。德意志帝国境内以日耳曼族为多数,少数斯拉夫人和犹太人。德意志帝国政府于普法战争后害怕法国会出兵报复,于是和其他欧洲国