训练集、验证集和测试集

✍ dations ◷ 2025-06-29 00:59:07 #机器学习,计算机科学

机器学习的普遍任务就是从数据中学习和构建模型(该过程称之为训练),并且能够在将来遇到的数据上进行预测。用于构建最终模型的数据集通常有多个;在构建模型的不同阶段,通常有三种数据集:训练集、验证集和测试集。

首先,模型在训练集(英语:training dataset)上进行拟合。对于监督式学习,训练集是由用来拟合参数(例如人工神经网络中神经元之间链接的权重)的样本组成的集合。在实践中,训练集通常是由输入向量(标量)和输出向量(标量)组成的数据对。其中输出向量(标量)被称为目标或标签。在训练过程中,当前模型会对训练集中的每个样本进行预测,并将预测结果与目标进行比较。根据比较的结果,学习算法会更新模型的参数。模型拟合的过程可能同时包括特征选择和参数估计。

接下来,拟合得到的模型会在第二个数据集——验证集(英语:validation dataset)——上进行预测。在对模型的超参数(英语:Hyperparameter_(machine_learning))(例如神经网络中隐藏层的神经元数量)进行调整时,验证集提供了对在训练集上拟合得到模型的无偏评估。验证集可用于正则化中的提前停止:在验证集误差上升时(这是在训练集上过拟合的信号),停止训练。不过,在实践中,由于验证集误差在训练过程中会有起伏,这种做法有时不奏效。由此,人们发明了一些规则,用做判定过拟合更好的信号。

最后,测试集(英语:test dataset)可被用来提供对最终模型的无偏评估。若测试集在训练过程中从未用到(例如,没有被用在交叉验证当中),则它也被称之为预留集。


相关

  • 神经外科学人体解剖学 - 人体生理学 组织学 - 胚胎学 人体寄生虫学 - 免疫学 病理学 - 病理生理学 细胞学 - 营养学 流行病学 - 药理学 - 毒理学神经外科,也常称作脑外科,是外科的一个
  • 四样植物住棚节四样植物 (希伯来语:.mw-parser-output .script-hebrew,.mw-parser-output .script-Hebr{font-size:1.15em;font-family:"Ezra SIL","Ezra SIL SR","Keter Aram Tsova",
  • 脏腑脏腑,是中医对内脏的总称,通称五脏六腑。根据《素问‧五脏别论篇》,“脏”指的是人体内的五脏,即:肝、心、脾、肺、肾(加上心包即为六脏),主要功能为生化和蓄存精气;以及六腑,即:胆、小
  • 内核地球的内核,是地球的最深层的部分,半径1220公里。一般相信它以铁-镍之合金组成,以及大概与太阳表面温度相同,约为5700开氏度。内地核的温度与压力可以通过理论与试验方式估计出
  • 海座星纲详见内文海座星(Edrioasteroid)是一类已灭绝的棘皮动物,生存于寒武纪中期至二叠纪。无茎(Column),身体扁平,球形或圆柱形,典型的在壳体上具有五条直的或弯曲的由口中伸出来食物沟。
  • 培植肉培植肉,亦作人造肉、人工肉、试管肉、清洁肉或合成肉,指任何并非从动物身上取得的肉类,而是透过生物工程培养动物的肌肉细胞而成。原理是先从动物体内抽取干细胞,再放进试管或培
  • 阿勒颇大清真寺阿勒颇大清真寺(阿拉伯语:جامع حلب الكبير‎),又名阿勒颇倭马亚清真寺(阿拉伯语:جامع بني أمية بحلب‎),是叙利亚第一大城市阿勒颇主要的清真寺,位于阿
  • 威比奖威比奖(英语:the Webby Awards)是由国际数字艺术与科学学院主办的评选全球最佳网站的奖项。这个奖项开始于1996年。威比奖中还有一个人民之声奖是所有人都可以参与投票的奖项。
  • 半远洋性沉积物半远洋性沉积物或半深海沉积物是远海沉积物的一种,是由纹路细腻的生物(英语:Biogenic substance)和陆源物质所组成,不同之处在于远海沉积物主要是由几乎不含路原物质的生物物质所
  • Zveno计划Zveno(俄语:Звено,本意译为连结,可理解为空军单位 "小队")是一个航空母机或称连环机的概念计划,被1930年代的苏联所采用。使用图波列夫TB-1或图波列夫TB-3重型轰炸机作为母