训练集、验证集和测试集

✍ dations ◷ 2025-04-04 11:05:17 #机器学习,计算机科学

机器学习的普遍任务就是从数据中学习和构建模型(该过程称之为训练),并且能够在将来遇到的数据上进行预测。用于构建最终模型的数据集通常有多个;在构建模型的不同阶段,通常有三种数据集:训练集、验证集和测试集。

首先,模型在训练集(英语:training dataset)上进行拟合。对于监督式学习,训练集是由用来拟合参数(例如人工神经网络中神经元之间链接的权重)的样本组成的集合。在实践中,训练集通常是由输入向量(标量)和输出向量(标量)组成的数据对。其中输出向量(标量)被称为目标或标签。在训练过程中,当前模型会对训练集中的每个样本进行预测,并将预测结果与目标进行比较。根据比较的结果,学习算法会更新模型的参数。模型拟合的过程可能同时包括特征选择和参数估计。

接下来,拟合得到的模型会在第二个数据集——验证集(英语:validation dataset)——上进行预测。在对模型的超参数(英语:Hyperparameter_(machine_learning))(例如神经网络中隐藏层的神经元数量)进行调整时,验证集提供了对在训练集上拟合得到模型的无偏评估。验证集可用于正则化中的提前停止:在验证集误差上升时(这是在训练集上过拟合的信号),停止训练。不过,在实践中,由于验证集误差在训练过程中会有起伏,这种做法有时不奏效。由此,人们发明了一些规则,用做判定过拟合更好的信号。

最后,测试集(英语:test dataset)可被用来提供对最终模型的无偏评估。若测试集在训练过程中从未用到(例如,没有被用在交叉验证当中),则它也被称之为预留集。


相关

  • 视网膜中央动脉阻塞视网膜中央动脉阻塞(英语:central retinal artery occlusion, 简称:CRAO),是一种严重的眼科急症。一个眼科急诊医生如果对此病误诊、漏诊,将给病人带来无可挽回的视力损失。顾名思
  • 铯-137铯-137(英语:Caesium-137,符号为Cs-137),是铯元素的一个放射性同位素,是一种主要由核裂变产生的核裂产物。铯-137的半衰期为30.17年。 大约95%通过贝塔衰变为barium-137m1 (137m1B
  • 内画内画壶是清朝末年发展起来的一种中国工艺品,最开始只是为了装饰鼻烟壶,后来逐渐发展成为一种独特的工艺。一般用半透明料器制造的鼻烟壶,也有高级的用水晶、玛瑙、翡翠等制作的
  • 斯堪地那维亚丹麦 挪威 瑞典有时包括: 芬兰 冰岛 法罗群岛 奥兰 不属于斯堪的纳维亚的北欧地区:斯堪的纳维亚(丹麦语、瑞典语:Skandinavien,挪威语:Skandinavia,萨米语:Skadesi-suolu、冰
  • N06A·B·C·D·G·H·QI·J·L·M·N·P·R·S·VATC代码N06(精神兴奋药)是解剖学治疗学及化学分类系统的一个药物分组,这是由世界卫生组织药物统计方法整合中心(The WHO Collabor
  • 深温仪深温仪(英语:Bathythermograph,缩写:BT)或称作机械式深温仪(英语:Mechanical Bathythermograph,缩写:MBT)是一种用于海洋研究的水下测温装置。外观为鱼雷状,拥有一个 温度感应器和转换
  • 立秋数据来源:喷气推进实验室线上历书系统立秋,是二十四节气之一,每年在8月7-9日之间,太阳位于黄经135°。立秋是二十四节气中的第十三个节气。每年8月7日或8日太阳到达黄经135度时
  • 继妃富察氏清太祖继妃(16世纪-1620年),姓富察氏,名衮代(满语:ᡤᡠᠨᡩᠠᡳ,太清:Gundei)。莽塞杜诸祜之女,清太祖努尔哈赤的继娶福晋,后世编撰的文献中称之为“继妃”、“清太祖继妃”。相关转述,称
  • 多哥兰多哥兰(Togoland)是德国在19世纪到第一次世界大战结束时在非洲西部的保护国。其国土除了包括现时之多哥全境以外,尚包括今日加纳东部的部分土地。第一次世界大战之后,德国战败,国
  • 台中市海线社区大学 台湾台中市梧栖区 台湾台中市清水区 台湾台中市龙井区 台中市海线社区大学(简称海线社大),海线社大本部位于台中市梧栖国中内。台中市海线社区大学官方网站:https://sea.