训练集、验证集和测试集

✍ dations ◷ 2025-04-26 09:40:35 #机器学习,计算机科学

机器学习的普遍任务就是从数据中学习和构建模型(该过程称之为训练),并且能够在将来遇到的数据上进行预测。用于构建最终模型的数据集通常有多个;在构建模型的不同阶段,通常有三种数据集:训练集、验证集和测试集。

首先,模型在训练集(英语:training dataset)上进行拟合。对于监督式学习,训练集是由用来拟合参数(例如人工神经网络中神经元之间链接的权重)的样本组成的集合。在实践中,训练集通常是由输入向量(标量)和输出向量(标量)组成的数据对。其中输出向量(标量)被称为目标或标签。在训练过程中,当前模型会对训练集中的每个样本进行预测,并将预测结果与目标进行比较。根据比较的结果,学习算法会更新模型的参数。模型拟合的过程可能同时包括特征选择和参数估计。

接下来,拟合得到的模型会在第二个数据集——验证集(英语:validation dataset)——上进行预测。在对模型的超参数(英语:Hyperparameter_(machine_learning))(例如神经网络中隐藏层的神经元数量)进行调整时,验证集提供了对在训练集上拟合得到模型的无偏评估。验证集可用于正则化中的提前停止:在验证集误差上升时(这是在训练集上过拟合的信号),停止训练。不过,在实践中,由于验证集误差在训练过程中会有起伏,这种做法有时不奏效。由此,人们发明了一些规则,用做判定过拟合更好的信号。

最后,测试集(英语:test dataset)可被用来提供对最终模型的无偏评估。若测试集在训练过程中从未用到(例如,没有被用在交叉验证当中),则它也被称之为预留集。


相关

  • 美国食物药品监督管理局美国食品药品监督管理局(英语:U.S. Food and Drug Administration,缩写为FDA)为美国卫生与公众服务部直辖的联邦政府机构,其主要职能为负责对美国国内生产及进口的食品、膳食补充
  • 杏林大学杏林大学(日语:きょうりんだいがく),简称杏林大,是一所本部位于东京都三鹰市新川6-20-2的日本的私立大学。1970年设立。 杏林大学拥有位于三鹰市和八王子市的三个校区,是一所设有
  • 1,4-丁二醇1,4-丁二醇(化学式:HOCH2CH2CH2CH2OH)是丁二醇异构体之一,是丁烷的末端二羟基取代物,室温下为无色粘稠液体。工业上,用乙炔与两分子的甲醛反应生成1,4-丁炔二醇再加氢的方法制取1,
  • 地基地基是指建筑物下面支承基础的土体或岩体。作为建筑地基的土层分为岩石、碎石土、砂土、粉土、黏性土和人工填土。当土层的地质状况较好,承载力较强时可以采用天然地基;而在地
  • 塞斯·诺特博姆塞斯‧诺特博姆(Cees Nooteboom,1933年7月31日-),荷兰作家、诗人。主要作品包括Rituelen (Rituals, 1980)、Een lied van schijn en wezen (A Song of Truth and Semblance, 1981
  • 海生真菌海洋真菌(marine fungi),或海生真菌,是生活在海洋或潮间带中的真菌。海洋真菌并不是一个分类单元,而是泛指分属于不同分类群,但生长环境均位于海洋或潮间带的多种真菌。绝对海生真
  • 食物与燃料之争食物与燃料之争(Food vs. fuel)是指占用耕地或者挪用粮食作物用以生产生物燃料,可能会导致粮食安全受到损害的全球规模的困境。整个国际范围内都存在"食物还是燃料"的争论,并
  • 鸟神星鸟神星(英语:Makemake/Maha-Maha,发音为:/ˌmɑːkiːˈmɑːkiː/ MAH-kee-MAH-kee或/ˌmɑːkeɪˈmɑːkeɪ/ MAH-kay-MAH-kay),正式名称为 (136472) Makemake,是太阳系内已知的
  • 对流层 (恒星)对流层是在恒星内部以对流为传输能量主要方式的半径区域。在辐射层,能量经由辐射传递。恒星的对流包括内部等离子的质量移动,通常是形成热等离子上升,冷等离子下沉的回路。在史
  • 安息年安息年(希伯来语:.mw-parser-output .script-hebrew,.mw-parser-output .script-Hebr{font-size:1.15em;font-family:"Ezra SIL","Ezra SIL SR","Keter Aram Tsova","Taamey A