剪枝

✍ dations ◷ 2024-12-23 05:04:20 #机器学习小作品,机器学习

剪枝(英语:pruning)是机器学习与搜索算法当中通过移除决策树中分辨能力较弱的部分而减小决策树大小的方法。剪枝降低了模型的复杂度,因此能够降低过拟合风险,从而降低泛化误差。

在决策树算法中,决策树过大会有过拟合的风险,从而在新样本上的泛化性能很差;决策树过小则无法从样本空间中获取重要的结构化信息。然而,由于很难判断新增一个额外的分裂结点能否显著降低误差,人们很难判断何时停止决策树的生长是恰当的。该问题被称为视界限制效应(英语:Horizon_effect)。一个通用的策略是让决策树一直生长,直到每个叶子结点都包含足够少量的样本,而后通过剪枝的方法,移除分辨能力较弱的结点。

剪枝应当在减小决策树大小的同时,保证交叉验证下的精度不降低。

相关

  • 伊巴密浓达伊巴密浓达(英语: Epaminondas;希腊语:Ἐπαμεινώνδας,又译作埃帕米农达、义巴敏诺达,前418年-前362年),古希腊城邦底比斯的将军与政治家。其领导底比斯脱离斯巴达的控制,
  • 免疫抑制疗法免疫抑制(英语:immunosuppression)是指对于免疫应答的抑制作用。免疫抑制可由天然或人为因素导致。天然免疫抑制包括天然免疫耐受,机体可能会对自身组织成分不产生免疫应答。人
  • 白三烯C4白三烯C4 (英语:Leukotriene C4)是一种白三烯,是白三烯A4在谷胱甘肽S-转移酶或白三烯C4合酶的作用下与谷胱甘肽分子缩合而成。医学导航:遗传代谢缺陷代谢、k,c/g/r/p/y/i,f/h/s
  • 八世纪公元701年1月1日至800年12月31日的这一段期间被称为8世纪。武则天死后,李氏再度执掌大唐帝国,唐玄宗时期出现了开元盛世。安史之乱是唐由盛转衰的转折点,决定了8世纪后期军阀割
  • 衍徴共有衍征或共源性状,在演化生物学是一种两个或以上终端分类单元共有及从其最近共同祖先承袭的衍生性状状态。共有衍征是一种衍生而来的性状状态,并源自其后最共同祖先。假若有
  • 奥肯法则奥肯法则(Okun's Law)指的是经济增长率与失业率之间的交替关系,即经济增长率越高,失业率就越低。就业水平取决于社会总产出。社会总产出越多,其所要求的劳动力投入也就越多。具体
  • 肩胛上切迹肩胛上切迹(Suprascapular notch)位于肩胛骨上缘,位于喙突(英语:coracoid process)的内侧。肩胛上切迹的上侧会被肩胛上横韧带(英语:superior transverse scapular ligament)封住,形成
  • 约翰·弗里德里希·格梅林约翰·弗里德里希·格梅林(德语:Johann Friedrich Gmelin,1748年8月8日-1804年11月1日)是德国博物学家、植物学家、昆虫学家、爬虫两栖类学家和软体动物学家。1748年,约翰·弗里德
  • 林承芳林承芳(?-?),字开先,广东广州府三水县人,明朝政治人物。万历元年(1573年)癸酉科乡试六十五名举人。万历十四年(1586年),登二甲第二名进士。任改翰林院庶吉士。授翰林院编修。出为江西参议
  • 兴富发建设兴富发建设股份有限公司(英语:Highwealth Construction),又称兴富发建设或兴富发,是一家台湾的建设公司。北部地区中部地区南部地区