剪枝

✍ dations ◷ 2025-08-13 19:01:39 #机器学习小作品,机器学习

剪枝(英语:pruning)是机器学习与搜索算法当中通过移除决策树中分辨能力较弱的部分而减小决策树大小的方法。剪枝降低了模型的复杂度,因此能够降低过拟合风险,从而降低泛化误差。

在决策树算法中,决策树过大会有过拟合的风险,从而在新样本上的泛化性能很差;决策树过小则无法从样本空间中获取重要的结构化信息。然而,由于很难判断新增一个额外的分裂结点能否显著降低误差,人们很难判断何时停止决策树的生长是恰当的。该问题被称为视界限制效应(英语:Horizon_effect)。一个通用的策略是让决策树一直生长,直到每个叶子结点都包含足够少量的样本,而后通过剪枝的方法,移除分辨能力较弱的结点。

剪枝应当在减小决策树大小的同时,保证交叉验证下的精度不降低。

相关

  • 输尿管囊肿输尿管囊肿(Ureterocele)在输尿管中所发现的"输尿管先天畸形"病症。此种病症称为输尿管囊肿症(ureteroceles),输尿管气球产生在膀胱开口处,并形成一个"囊袋"(sac-like pouch)
  • 失聪听觉障碍(英语:Hearing loss)又称听力缺损,指听觉部分或完全丧失,而耳聋人士则是指完全没有或几乎没有听力者。听力缺损可能发生在单耳或双耳,有可能是暂时或永久性质。孩童的听力
  • 潍川县潍川县(越南语:Huyện Duy Xuyên/.mw-parser-output .han-nom{font-family:"Nom Na Tong","Han-Nom Gothic","Han-Nom Ming","HAN NOM A","HAN NOM B","Ming-Lt-HKSCS-UNI-H",
  • 蕨类植物蕨类植物(Pteridophyta)是维管植物排除了种子植物所形成的并系群,曾长期被视为植物界中的一个单系类群,现因为蕨类植物不构成单系群,而被拆分为石松门和链束植物。蕨类植物特征为
  • 发电厂发电厂(英语:Power station、Generating station、Power plant、Powerhouse),又称发电站或电厂,是将热能或动能转换为电能的设施,属于电力系统一环。根据原动机的不同来分类有:其中
  • 惊讶惊讶指的是当人在听到一些令人震惊或难以置信的事情时,所表现出来的一种表情。通常有惊讶表情的人很有可能会陷入不安或是该如何回答的焦虑情况之中,所以通常这种时候必须要让
  • 基奥加湖基奥加湖(英语:Lake Kyoga)是乌干达中部的大型淡水湖,面积1,720平方公里,海拔914米,属于大湖地区的水体系统。基奥加湖大部分区域的水深大于4米,最大深度约5.7米,水深少于3米的地区
  • 阿希尔·卡斯蒂格利尼阿希尔·卡斯蒂格利尼(意大利语:Achille Castiglioni,1918年2月16日-2002年12月2日) 是一位意大利家具、灯具、音响及其它物件的设计师。他出生于米兰。他的设计风格相当有个人
  • 约瑟夫·斯发基斯约瑟夫·斯发基斯(英语:Joseph Sifakis,希腊语:Ιωσήφ Σηφάκης,1946年12月26日-)是一名希腊计算机科学家和他也有法国国籍 。2007年,他与爱德蒙·克拉克和艾伦·爱默生一
  • 巴希尔·扎哈罗夫巴希尔·扎哈罗夫(希腊语:Βασίλειος Ζαχάρωφ,土耳其语:Basil Zaharoff;1849年10月6日-1936年11月27日),本名巴西里奥斯·扎哈利亚斯(希腊语:Βασίλειος Ζα