交叉验证

✍ dations ◷ 2025-11-18 23:52:27 #交叉验证
交叉验证,有时亦称循环估计 , 是一种统计学上将数据样本切割成较小子集的实用方法。于是可以先在一个子集上做分析,而其它子集则用来做后续对此分析的确认及验证。一开始的子集被称为训练集。而其它的子集则被称为验证集或测试集。交叉验证的目的,是用未用来给模型作训练的新数据,测试模型的性能,以便减少诸如过拟合和选择偏差等问题,并给出模型如何在一个独立的数据集上通用化(即,一个未知的数据集,如实际问题中的数据)。交叉验证的理论是由Seymour Geisser(英语:Seymour Geisser)所开始的。它对于防范根据数据建议的测试假设是非常重要的,特别是当后续的样本是危险、成本过高或科学上不适合时去搜集。假设有个未知模型具有一个或多个待定的参数,且有一个数据集能够反映该模型的特征属性(训练集)。适应的过程是对模型的参数进行调整,以使模型尽可能反映训练集的特征。如果从同一个训练样本中选择独立的样本作为验证集合,当模型因训练集过小或参数不合适而产生过拟合时,验证集的测试予以反映。 交叉验证是一种预测模型拟合性能的方法。常识来说,Holdout 验证并非一种交叉验证,因为数据并没有交叉使用。 随机从最初的样本中选出部分,形成交叉验证数据,而剩余的就当做训练数据。 一般来说,少于原本样本三分之一的数据被选做验证数据。k折交叉验证(英语:k-fold cross-validation),将训练集分割成k个子样本,一个单独的子样本被保留作为验证模型的数据,其他k − 1个样本用来训练。交叉验证重复k次,每个子样本验证一次,平均k次的结果或者使用其它结合方式,最终得到一个单一估测。这个方法的优势在于,同时重复运用随机产生的子样本进行训练和验证,每次的结果验证一次,10次交叉验证是最常用的。正如名称所建议,留一验证(英语:leave-one-out cross-validation, LOOCV)意指只使用原本样本中的一项来当做验证资料,而剩余的则留下来当做训练资料。这个步骤一直持续到每个样本都被当做一次验证资料。 事实上,这等同于k折交叉验证,其中k为原本样本个数。 在某些情况下是存在有效率的算法,如使用kernel regression(英语:kernel regression) 和吉洪诺夫正则化。可以计算估计误差。常见的误差衡量标准是均方差和方根均方差, 分别为交叉验证的方差和标准差。

相关

  • Cefixime头孢克肟(Cefixime)是一种口服的第三代头孢菌素抗生素,通常用于治疗淋病、扁桃腺炎和咽炎。常用剂量为400毫克。头孢克肟在美国以“Suprax”的名称发售,直到2003年,当它的专利失
  • 梅格洛玻利斯梅格洛玻利斯(希腊语:Μεγαλόπολη)是希腊南部阿卡迪亚州西南部的一个城镇。该城始建于公元前371年,是当时该地区最早实现城市化的地方。著名历史学家波利比乌斯即生于
  • 行距在字体排印学,行距(Leading)指代字体连续行的基线间的距离。这个词起源于手工排版的年代,铅字之间通过插入铅块来增加垂直距离。这个术语仍然被应用于如 QuarkXPress(英语:QuarkXP
  • 法拉语法拉语(Fala)是罗曼语族的一门语言,通常被认为是葡萄牙-加利西亚语的下属语言之一。法拉语在西班牙埃斯特雷马杜拉靠近葡萄牙国界的部分地区使用,使用人口约有10,500人。2015年,
  • 雷佐尼可宫雷佐尼科宫(Ca' Rezzonico)是威尼斯大运河边的一座宫殿,目前作为公共博物馆,展出18世纪威尼斯艺术品。雷佐尼科宫座落在大运河的右岸,圣巴拿巴河在此汇入大运河。这个地点原是威
  • 波音公司波音公司(英语:The Boeing Company)是美国一家开发、生产及销售固定翼飞机、旋翼机、运载火箭、导弹和人造卫星等产品,为世界最大的航天航空器制造商。于1997年并购麦克唐纳-道
  • 玛格丽特玛格丽特(苏格兰盖尔语:Mairead或Maighread,1283年4月9日-1290年9月26日)是苏格兰女王(1286年11月25日–1290年9月26日在位)及挪威公主,也被称为苏格兰的玛格丽特(挪威语:Margrete av
  • 脱氧核糖核酸酶去氧核糖核酸酶(英语:Deoxyribonuclease;缩写:DNase)又称DNA酶,是指能经由水解作用,将DNA骨架上的磷酸双酯键切断的酶。DNA酶是核酸酶(nuclease)中的一种,目前已知的DNA酶有许多不同类
  • 亚述人亚述人(阿拉米语:ܥܡܐ ܐܬܘܪܝܐ ;希伯来语:אשורים ;阿拉伯语:الآشوريون ),又称叙利亚人(Syriacs),是主要生活在西亚两河流域北部的一个民族集团,属于阿卡德人的分
  • 斯蒂夫·沃兹尼亚克史蒂芬·加里·沃兹尼亚克(英语:Stephen Gary Wozniak,1950年8月11日-),美国电脑工程师,曾与斯蒂夫·乔布斯合伙创立苹果电脑(今苹果公司)。沃兹尼亚克在1970年代中期创造出第一代苹