交叉验证

✍ dations ◷ 2025-01-23 09:31:39 #交叉验证
交叉验证,有时亦称循环估计 , 是一种统计学上将数据样本切割成较小子集的实用方法。于是可以先在一个子集上做分析,而其它子集则用来做后续对此分析的确认及验证。一开始的子集被称为训练集。而其它的子集则被称为验证集或测试集。交叉验证的目的,是用未用来给模型作训练的新数据,测试模型的性能,以便减少诸如过拟合和选择偏差等问题,并给出模型如何在一个独立的数据集上通用化(即,一个未知的数据集,如实际问题中的数据)。交叉验证的理论是由Seymour Geisser(英语:Seymour Geisser)所开始的。它对于防范根据数据建议的测试假设是非常重要的,特别是当后续的样本是危险、成本过高或科学上不适合时去搜集。假设有个未知模型具有一个或多个待定的参数,且有一个数据集能够反映该模型的特征属性(训练集)。适应的过程是对模型的参数进行调整,以使模型尽可能反映训练集的特征。如果从同一个训练样本中选择独立的样本作为验证集合,当模型因训练集过小或参数不合适而产生过拟合时,验证集的测试予以反映。 交叉验证是一种预测模型拟合性能的方法。常识来说,Holdout 验证并非一种交叉验证,因为数据并没有交叉使用。 随机从最初的样本中选出部分,形成交叉验证数据,而剩余的就当做训练数据。 一般来说,少于原本样本三分之一的数据被选做验证数据。k折交叉验证(英语:k-fold cross-validation),将训练集分割成k个子样本,一个单独的子样本被保留作为验证模型的数据,其他k − 1个样本用来训练。交叉验证重复k次,每个子样本验证一次,平均k次的结果或者使用其它结合方式,最终得到一个单一估测。这个方法的优势在于,同时重复运用随机产生的子样本进行训练和验证,每次的结果验证一次,10次交叉验证是最常用的。正如名称所建议,留一验证(英语:leave-one-out cross-validation, LOOCV)意指只使用原本样本中的一项来当做验证资料,而剩余的则留下来当做训练资料。这个步骤一直持续到每个样本都被当做一次验证资料。 事实上,这等同于k折交叉验证,其中k为原本样本个数。 在某些情况下是存在有效率的算法,如使用kernel regression(英语:kernel regression) 和吉洪诺夫正则化。可以计算估计误差。常见的误差衡量标准是均方差和方根均方差, 分别为交叉验证的方差和标准差。

相关

  • 西酞普兰西酞普兰(Citalopram)是一种很强的选择性5-羟色胺再吸收抑制剂(SSRI)型的抗抑郁药,其药物形态为氢溴酸西酞普兰(Citalopram Hydrobromide),商品名为“喜普妙”(Celexa)。在临床上常用
  • 海鲜海鲜又称海产、海味,是指海洋中可食用的生物,包括了鱼类、甲壳类(虾、蟹)、贝类、软体动物与棘皮动物。虽然海带、海藻等海洋植物也是常用来烹饪美食的食材,但是海鲜主要还是指海
  • 躲猫猫躲猫猫(英语:Peekaboo或Peek-a-boo),是一种逗乐婴儿、幼儿的游戏。躲猫猫的反复遮眼玩法多是西方国家逗乐婴儿的游戏,玩法是父母用双手蒙住自己的脸,然后靠近婴儿,将手突然拿开,变出
  • 化学键化学键(英语:Chemical Bond)是一种粒子间的结合模式,其中粒子可以是原子或离子。透过化学键,粒子可组成多原子的化学物质。键由两相反电荷间的电磁力引起,电荷可能来自电子和原子
  • Amgen Inc.安进(AMGen,原称Applied Molecular Genetics)是一家美国制药公司,总部位于加州千橡市。它成立于1980年,经过多次兼并之后,成为现在世界最大的制药公司之一。2019年8月,安进宣布计划
  • 认知功能障碍发展障碍、发展迟缓(Developmental disorders),也称心理发展障碍,是一类儿童学习障碍和相关的发育障碍的总称。其包含特殊性发育障碍和广泛性发育障碍。该自闭症关联团体组织的
  • 醪醴在东亚地区,浊酒,又称浊醪、醪醴,一种传统酿造酒,为未经过滤程序的米酒。带有米渣,因此其颜色呈乳白色,又被称为白酒。陈放较久的浊酒,颜色转黄,称黄酒;经过滤、去色后,就成为清酒。在
  • 库尔斯克州库尔斯克州(俄语:Курская область,罗马化:Kurskaya oblast)是俄罗斯联邦主体之一,属中央联邦管区。西南部及西部与乌克兰接壤。面积29,800平方公里,人口1,235,091 (2
  • CD249谷氨酰氨基肽酶,又称氨基肽酶A,旧称血管紧张素酶A。它由ENPEP基因编码,且高度保守。谷氨酰氨基肽酶是一种膜结合锌蛋白,能催化谷氨酸和天冬氨酸从肽链的N末端水解。例如,把血管紧
  • 仙鹤丹顶鹤(学名:Grus japonensis),也叫仙鹤、满洲鹤、日本鹤、