交叉验证

✍ dations ◷ 2025-10-05 14:37:16 #交叉验证
交叉验证,有时亦称循环估计 , 是一种统计学上将数据样本切割成较小子集的实用方法。于是可以先在一个子集上做分析,而其它子集则用来做后续对此分析的确认及验证。一开始的子集被称为训练集。而其它的子集则被称为验证集或测试集。交叉验证的目的,是用未用来给模型作训练的新数据,测试模型的性能,以便减少诸如过拟合和选择偏差等问题,并给出模型如何在一个独立的数据集上通用化(即,一个未知的数据集,如实际问题中的数据)。交叉验证的理论是由Seymour Geisser(英语:Seymour Geisser)所开始的。它对于防范根据数据建议的测试假设是非常重要的,特别是当后续的样本是危险、成本过高或科学上不适合时去搜集。假设有个未知模型具有一个或多个待定的参数,且有一个数据集能够反映该模型的特征属性(训练集)。适应的过程是对模型的参数进行调整,以使模型尽可能反映训练集的特征。如果从同一个训练样本中选择独立的样本作为验证集合,当模型因训练集过小或参数不合适而产生过拟合时,验证集的测试予以反映。 交叉验证是一种预测模型拟合性能的方法。常识来说,Holdout 验证并非一种交叉验证,因为数据并没有交叉使用。 随机从最初的样本中选出部分,形成交叉验证数据,而剩余的就当做训练数据。 一般来说,少于原本样本三分之一的数据被选做验证数据。k折交叉验证(英语:k-fold cross-validation),将训练集分割成k个子样本,一个单独的子样本被保留作为验证模型的数据,其他k − 1个样本用来训练。交叉验证重复k次,每个子样本验证一次,平均k次的结果或者使用其它结合方式,最终得到一个单一估测。这个方法的优势在于,同时重复运用随机产生的子样本进行训练和验证,每次的结果验证一次,10次交叉验证是最常用的。正如名称所建议,留一验证(英语:leave-one-out cross-validation, LOOCV)意指只使用原本样本中的一项来当做验证资料,而剩余的则留下来当做训练资料。这个步骤一直持续到每个样本都被当做一次验证资料。 事实上,这等同于k折交叉验证,其中k为原本样本个数。 在某些情况下是存在有效率的算法,如使用kernel regression(英语:kernel regression) 和吉洪诺夫正则化。可以计算估计误差。常见的误差衡量标准是均方差和方根均方差, 分别为交叉验证的方差和标准差。

相关

  • 联合国改革联合国改革,自从联合国产生之日起,就在不断进行。联合国改革一词的指涉范围很广,包括从希望消灭联合国的到希望联合国有全面功能主张的支持者,都称他们的看法为联合国改革。而联
  • 生物工程学生物工程学(Biological Engineering或bioengineering),是一种即综合利用数学、物理学、化学、生物学的知识,以及工程学本身的方法,以应对在生物学及医药学等领域等各种问题,满足人
  • Pongo猩猩属(学名:Pongo),也叫人猿、红猩猩、红毛猩猩,灵长目人科的一属,与猴子最大不同的地方就是没有尾巴,能用手或脚拿东西。马来语和印尼语叫做Orang utan,意思 “森林中的人”。与人
  • 鳄梨油鳄梨油是指用鳄梨(Persea americana)果实压榨而成的植物油。除作为食用油外,鳄梨油还被用作润滑油,或用于制作化妆品。鳄梨油富含单不饱和脂肪酸与维生素E,同时可以促进类胡萝卜
  • 麸质麸质,又称麸质蛋白、麦胶、面筋、面筋蛋白、谷胶蛋白,存在于多种谷物中,是大麦、小麦、燕麦、黑麦等谷物中最普遍的蛋白质。麸质蛋白是种贮藏蛋白复合物,主要由醇溶蛋白以及谷蛋
  • 约阿希姆·弗兰克约阿希姆·弗兰克(德语:Joachim Frank,1940年9月12日-),德美双籍生物学家。现于哥伦比亚大学任教。他被公认为“低温电子显微镜之父”。2017年与雅克·杜布歇、理查德·亨德森获得
  • 相变相变(又称物态变化,英语:Phase Transition)是指物质在外部参数(如:温度、压力、磁场等等)连续变化之下,从一种相(态)忽然变成另一种相,最常见的是冰变成水和水变成蒸气。然而,除了物体的
  • 蓬皮杜中心蓬皮杜中心(法语:Centre Georges-Pompidou)全名为蓬皮杜国家艺术和文化中心(Centre national d'art et de culture Georges-Pompidou),是一栋座落于法国首都巴黎第四区的复合建筑,
  • 鸟苷单磷酸鸟苷酸(Guanosine monophosphate,或译鸟苷单磷酸、一磷酸鸟苷、鸟苷一磷酸或单磷酸鸟苷,缩写GMP)是一种核苷酸,常见于食品添加剂中作为鲜味剂,其结构由磷酸基团、五碳糖,以及鸟嘌呤
  • 自我管理自我管理、自制力、自我控制是冲动控制的其中一个面向。具体的定义是:面对诱惑及突然的渴望时管理自己的情绪(英语:Emotional self-regulation)、想法、和行为的能力。自制力是