首页 >
交叉验证
✍ dations ◷ 2025-04-04 07:46:15 #交叉验证
交叉验证,有时亦称循环估计 ,
是一种统计学上将数据样本切割成较小子集的实用方法。于是可以先在一个子集上做分析,而其它子集则用来做后续对此分析的确认及验证。一开始的子集被称为训练集。而其它的子集则被称为验证集或测试集。交叉验证的目的,是用未用来给模型作训练的新数据,测试模型的性能,以便减少诸如过拟合和选择偏差等问题,并给出模型如何在一个独立的数据集上通用化(即,一个未知的数据集,如实际问题中的数据)。交叉验证的理论是由Seymour Geisser(英语:Seymour Geisser)所开始的。它对于防范根据数据建议的测试假设是非常重要的,特别是当后续的样本是危险、成本过高或科学上不适合时去搜集。假设有个未知模型具有一个或多个待定的参数,且有一个数据集能够反映该模型的特征属性(训练集)。适应的过程是对模型的参数进行调整,以使模型尽可能反映训练集的特征。如果从同一个训练样本中选择独立的样本作为验证集合,当模型因训练集过小或参数不合适而产生过拟合时,验证集的测试予以反映。
交叉验证是一种预测模型拟合性能的方法。常识来说,Holdout 验证并非一种交叉验证,因为数据并没有交叉使用。
随机从最初的样本中选出部分,形成交叉验证数据,而剩余的就当做训练数据。
一般来说,少于原本样本三分之一的数据被选做验证数据。k折交叉验证(英语:k-fold cross-validation),将训练集分割成k个子样本,一个单独的子样本被保留作为验证模型的数据,其他k − 1个样本用来训练。交叉验证重复k次,每个子样本验证一次,平均k次的结果或者使用其它结合方式,最终得到一个单一估测。这个方法的优势在于,同时重复运用随机产生的子样本进行训练和验证,每次的结果验证一次,10次交叉验证是最常用的。正如名称所建议,留一验证(英语:leave-one-out cross-validation, LOOCV)意指只使用原本样本中的一项来当做验证资料,而剩余的则留下来当做训练资料。这个步骤一直持续到每个样本都被当做一次验证资料。
事实上,这等同于k折交叉验证,其中k为原本样本个数。
在某些情况下是存在有效率的算法,如使用kernel regression(英语:kernel regression) 和吉洪诺夫正则化。可以计算估计误差。常见的误差衡量标准是均方差和方根均方差,
分别为交叉验证的方差和标准差。
相关
- 巴氏涂片检查巴氏涂片检查(英语:Papanicolaou test,简称Pap test),在港澳地区称为柏氏抹片检查,是一种子宫颈医学诊断方法,用于检查子宫颈癌等疾病。巴氏涂片检查的方式是,首先取得少量子宫颈细
- 神经冲动动作电位(英文:action potential),指的是静止膜电位状态的细胞膜受到适当刺激而产生的,短暂而有特殊波形的跨膜电位搏动。细胞产生动作电位的能力被称为兴奋性,有这种能力的细胞如
- 伦巴第人伦巴底人(拉丁语:Langobardi/意大利语:Longobardi)是日耳曼人的一支,起源于斯堪的纳维亚,今瑞典南部。经过约4个世纪的民族大迁徙,伦巴底人最后到达并占据了亚平宁半岛(今日意大利)的
- 日本脑炎病毒流行性乙型脑炎(英语:Japanese encephalitis,港澳台译为日本脑炎),中国大陆简称乙脑,是由流行性乙型脑炎病毒(英语:Japanese encephalitis virus)(JEV)导致的脑实质炎症,为主要病理改变
- span style=color:#ffffff;历史/span希腊历史传统上包括对于希腊人民,对于他们统治的地域,以及今天希腊国土内地区的历史研究。希腊人的定义和居住范围在历史上有很大的变动,因此希腊历史所牵涉的地域具有一定弹性
- 数字化数字电视(英语:Digital television)是指采编、播出、传输、接收等环节中全面采用数字信号的电视系统,与模拟电视相对。数字电视系统可以发送多种业务,如高清电视、标清电视、智能
- 美好年代美好年代(法语:Belle Époque)是欧洲社会史上的一段时期,从19世纪末开始,至第一次世界大战爆发而结束。美好年代是后人对此一时代的回顾,这个时期被上流阶级认为是一个“黄金时代
- 壬戌学制壬戌学制于1922年11月由北洋政府颁行,其提案为《学校系统改革案》。也称“1922年学制”,因这一年为旧历壬戌年,所以又称“壬戌学制”,为了有别于“壬子癸丑学制”,也称“新学制”
- 威廉姆斯敦威廉斯敦(Williamstown)是美国马萨诸塞州伯克希尔县的一个镇。
- 恋裤恋裤指对于裤子(包括运动裤、西装裤、涤纶运动裤、军裤、校裤、武术裤、足球裤、工装裤、紧身裤、牛仔裤、内裤、篮球裤、学校运动裤、官将裤...等)有特殊迷恋。这种现象有人