标准误差

✍ dations ◷ 2025-11-23 12:19:24 #标准误差
标准误差(英文:Standard Error),也称标准误,即样本平均数抽样分布(英语:Sampling distribution)的标准差(英文:Standard Deviation),是描述对应的样本平均数抽样分布的离散程度及衡量对应样本平均数抽样误差大小的尺度。标准误差针对样本统计量而言,是某个样本统计量的标准差。当谈及标准误差时,一般须指明对应的样本统计量才有意义。以下以样本均值(样本均值是一种样本统计量)作为例子:例如, 样本均值是总体均值的无偏估计。但是,来自同一总量的不同样本可能有不同的均值。于是,假设可以从总体中随机选取无限的大小相同的样本,那每个样本都可以有一个样本均值。依此法可以得到一个由无限多样本均值组成的总体,该总体的标准差即为标准误差。在很多实际应用中,标准差的真正值通常是未知的。因此,标准误这个术语通常运用于代表这一未知量的估计。在这些情况下,需要清楚业已完成的和尝试去解决的标准误差仅仅可能是一个估量。然而,这通行上不太可能:人们可能往往采取更好的估量方法,而避免使用标准误,例如采用最大似然或更形式化的方法去测定置信区间。第一个众所周知的方法是在适当条件下可以采用学生t-分布为一个估量平均值提供置信区间。在其他情况下,标准差可以有效地利用于提供一个不确定性空间的示值,但其正式或半正式使用是提供置信区间或测试,并要求样本总量必须足够大。其总量大小取决于具体的数量分析。“样本均值的估计标准误差”,简称平均值标准误差(standard error of the mean, SEM),或平均数标准误差。必须记得在简称的背后总是意指“样本的”。如果已知总体的标准差(σ),那么抽取无限多份大小为 n 的样本,每个样本各有一个平均值,所有这个大小的样本之平均值的标准差可证明为(注意!不是一份样本里观察值的标准差(那是下面公式里的 s {displaystyle s} )):但由于通常σ为未知,此时可以用研究中取得样本的标准差 (s) 来估计 S D x ¯ {displaystyle SD_{bar {x}}} :其中,s为样本的标准差,n为样本数量(大小)。名词比较:注意:如果数据集服从正态分布,其正态分布函数的分位数、样本平均数和标准差都可以用来计算合适的平均数置信区间。以下公式表示在大于或小于95%的置信区间中, x ¯ {displaystyle {bar {x}}} 等于样本平均数时,S 等于样本平均数的标准差,1.96 则为服从正态分布的第 0.975百分位数值。特殊情况下,样本统计(比如样本平均数)的标准误是一个有偏误的估计标准。换句话说,标准误是一个样本统计的样本分布的标准差。这一标准误的符号可以是任何 S E {displaystyle SE} 、 S E M {displaystyle SEM} 、 S E {displaystyle S_{E}} 之一。标准误提供一系列在证明数值不确定性的简单方法,并通常用于:鉴于对上述标准误差的公式,假设样本量远小于总量规模,所以总量可以被视为足够大。当取样比例较大(大约为5%或以上)时,对标准误的估计必须用“有限总体校正”(finite population correction):该公式以考虑到增加所获得的采样精度,以接近的人口较大比例。有限总体校正的意义在于:如果样本大小 n 等于总量大小 N 时,有限总体校正数值为零。如果实测量 A 的数值不具有统计意义上的独立性,但是其仍然可以从已知的参数空间 x 中获取。那么一个误差的无偏估计可以通过以下方程获得:其中,样本偏差系数 ρ 为自相关系数 ρij (-1到1之间的数量)的平均值。相对标准误差(Relative Standard Error)仅仅是标准误除以平均值的一种百分比表述。例如,制作两份家庭收入调查,其平均值为50000美元。如果一个调查的标准误有10000美元,而另一个则为5000美元,其相对标准误差分别为20%和10%。直观地说,拥有较低标准误差的调查看起来更为可靠。事实上,由于制作数据机构通常预设可信度标准,以使得其统计数据必须满足此前公布的内容。譬如,美国国家卫生统计中心通常不会报告其数据相对标准误差超过30%的估计。

相关

  • 丁酸丁酸,又称酪酸,是化学式为CH3CH2CH2-COOH的羧酸和短链饱和脂肪酸,存在于腐臭的黄油、帕马森干酪、呕吐物和腋臭中。丁酸带有难闻的气味,味先辣后甜,与乙醚类似。10ppb浓度的丁酸
  • 布伦特兰夫人格罗·哈莱姆·布伦特兰(挪威语:Gro Harlem Brundtland, 读音 帮助·信息,1939年4月20日-),挪威政治家、外交家、医生,曾任挪威首相及世界卫生组织总干事。她被视为国际上的可持续
  • .mw-parser-output ruby.zy{text-align:justify;text-justify:none}.mw-parser-output ruby.zy>rp{user-select:none}.mw-parser-output ruby.zy>rt{font-feature-settings:
  • 双盲双盲是科学方法的一种,目的是避免研究结果受安慰剂效应或观察者偏向所影响。在各种科学研究领域中,从医学、食品、心理到社会科学及法证都有使用双盲方法进行实验。单盲(Single
  • 龙胆酸龙胆酸 (标准名2,5-二羟基苯甲酸)是一种多羟基酸,它是水杨酸经肾代谢之后的次要产物(1%)。龙胆酸在工业上通过氢醌的科尔贝-施密特反应制备而得。龙胆酸属氢醌类化合物,容易发生氧
  • 伦巴第伦巴第(意大利语:Lombardia,意大利语发音:)是一个位于阿尔卑斯山和波河的一个意大利北部大区。它与意大利的其它大区皮埃蒙特、艾米利亚-罗马涅、威尼托、特伦蒂诺-上阿迪杰以及
  • 弩箭子甙弩箭子甙(英文名Antiarin)是由见血封喉树(Antiaris toxicaria)产生的一种强心苷。有两种结构形式,α-弩箭子甙和β-弩箭子甙。β-弩箭子甙,由见血封喉树产生的强心苷,不仅用于医疗
  • 贝尔特·福格尔斯泰因贝尔特·福格尔斯泰因(英语:Bert Vogelstein,1949年6月2日-),美国癌症研究者、霍华德·休斯医学研究所研究员。他是癌症基因组学领域的先驱,基于对大肠癌的研究,他于1988年提出一个
  • TATA结合蛋白1TGH、​1C9B、​1JFI、​1NVP、​4ROC、​4ROE、​4ROD、​5IY9、​5IYA、​5FUR、​5IYC、​5IYB、​5IY7、​5IY8、​5IYD、​5IY6690821374ENSG00000112592n/aP20226P29
  • C04A·B·C·D·G·H·QI·J·L·M·N·P·R·S·VATC代码C04(外周血管扩张剂)是解剖学治疗学及化学分类系统的一个药物分组,这是由世界卫生组织药物统计方法整合中心(The WHO Coll