训练集、验证集和测试集

✍ dations ◷ 2025-07-21 18:34:23 #机器学习,计算机科学

机器学习的普遍任务就是从数据中学习和构建模型(该过程称之为训练),并且能够在将来遇到的数据上进行预测。用于构建最终模型的数据集通常有多个;在构建模型的不同阶段,通常有三种数据集:训练集、验证集和测试集。

首先,模型在训练集(英语:training dataset)上进行拟合。对于监督式学习,训练集是由用来拟合参数(例如人工神经网络中神经元之间链接的权重)的样本组成的集合。在实践中,训练集通常是由输入向量(标量)和输出向量(标量)组成的数据对。其中输出向量(标量)被称为目标或标签。在训练过程中,当前模型会对训练集中的每个样本进行预测,并将预测结果与目标进行比较。根据比较的结果,学习算法会更新模型的参数。模型拟合的过程可能同时包括特征选择和参数估计。

接下来,拟合得到的模型会在第二个数据集——验证集(英语:validation dataset)——上进行预测。在对模型的超参数(英语:Hyperparameter_(machine_learning))(例如神经网络中隐藏层的神经元数量)进行调整时,验证集提供了对在训练集上拟合得到模型的无偏评估。验证集可用于正则化中的提前停止:在验证集误差上升时(这是在训练集上过拟合的信号),停止训练。不过,在实践中,由于验证集误差在训练过程中会有起伏,这种做法有时不奏效。由此,人们发明了一些规则,用做判定过拟合更好的信号。

最后,测试集(英语:test dataset)可被用来提供对最终模型的无偏评估。若测试集在训练过程中从未用到(例如,没有被用在交叉验证当中),则它也被称之为预留集。


相关

  • 胸锁乳突肌胸锁乳突肌(Sternocleidomastoid)是两块位于颈部,使头部前推或转动的肌肉。每块胸锁乳突肌从胸骨延伸到颈两侧耳朵下面的一点,还连接到锁骨和头骨的颞骨上。当这两块肌肉同时收
  • 世界无烟日世界无烟日(英语:World No Tobacco Day,或译世界无烟草日),是世界卫生组织在1987年创立的,现在每年的5月31日就是世界无烟日。第一个世界无烟日是1988年4月7日。世界无烟日的意义
  • 苏斯苏塞(阿拉伯语:سوسة‎  Sūsa)位于突尼斯东部哈马马特湾畔,是苏塞省的首府。位于首都突尼斯以南 140千米(87英里),有人口271,428人(2014年)。苏塞是一个渡假胜地,深受欧洲游客欢
  • 繁殖周期生物学上,生物生命周期指得是一个生物体在生命开始到结束周而复始所历经的一系列变化过程。“这个概念与生命史,发育生物学和个体发生学密切相关,但在强调再生方面有所差异。”
  • 曹春晓曹春晓(1934年8月6日-),男,浙江上虞人。1956年上海交通大学金属压力加工专业毕业,之后一直在北京航空材料研究院从事金属材料研究。现任研究员、博士生导师,1997年当选为中国科学院
  • 软陶软陶被称作“低温泥”或者“烧烤粘土”,但其本质上并非陶或者黏土,而是一种加入了液态增塑剂的PVC材料,同时常加入高岭土等少量其他材料以获得不同的特性。软陶有各种颜色,常被
  • 郑国锠郑国锠(1914年3月30日-2012年10月12日),江苏常熟人,中国植物细胞学家。1943年毕业于国立中央大学博物系。1950年获美国威斯康星大学博士学位。兰州大学生命科学院教授。1980年当
  • C语言C是一种通用的编程语言,广泛用于系统软件与应用软件的开发。于1969年至1973年间,为了移植与开发UNIX操作系统,由丹尼斯·里奇与肯·汤普逊,以B语言为基础,在贝尔实验室设计、开发
  • 时代计划时代计划(英语:Tempora),又译颞颥计划,是英国政府通信总部(GCHQ)的秘密计算机大规模监控系统代号。这个系统的功能是暂时存储经光纤传输的大部分互联网通讯,以便在事后作进一步分析
  • 温州模式温州模式是指中国在改革开放以后,发源于浙江台州椒江区海门镇,后以浙江温州地区为代表,涵盖台州地区在内的一种经济发展模式。是一种放手发展民营经济,发展市场经济,政府在经济发