剪枝

✍ dations ◷ 2025-02-24 01:47:08 #机器学习小作品,机器学习

剪枝(英语:pruning)是机器学习与搜索算法当中通过移除决策树中分辨能力较弱的部分而减小决策树大小的方法。剪枝降低了模型的复杂度,因此能够降低过拟合风险,从而降低泛化误差。

在决策树算法中,决策树过大会有过拟合的风险,从而在新样本上的泛化性能很差;决策树过小则无法从样本空间中获取重要的结构化信息。然而,由于很难判断新增一个额外的分裂结点能否显著降低误差,人们很难判断何时停止决策树的生长是恰当的。该问题被称为视界限制效应(英语:Horizon_effect)。一个通用的策略是让决策树一直生长,直到每个叶子结点都包含足够少量的样本,而后通过剪枝的方法,移除分辨能力较弱的结点。

剪枝应当在减小决策树大小的同时,保证交叉验证下的精度不降低。

相关

  • 琉球语琉球语(冲绳语:ルーチューグチ),又称岛言叶(しまくとぅば),属日本琉球语系,分布在冲绳县、鹿儿岛县奄美群岛,是对琉球群岛(包括奄美群岛及冲绳群岛)一系列本土语言的统称。由于各种琉球
  • 草露宝光草露宝光或简称宝光(来自于德文 “Heiligenschein” 意为“halo”(光环)或“aureola”(光背),字面意思为“神圣的光”,发音:.mw-parser-output .IPA{font-family:"Charis SIL","Doul
  • 化学电池电化电池包含两种类型,一类是发生化学反应(氧化还原反应)将化学能转为电能的装置,又称伽凡尼电池;另一种则是输入电能引发化学反应的电解池。两个半电池可结合成一个电池。
  • 公共卫生学公共卫生是通过组织社区资源,为公众提供疾病预防和健康促进的一门管理学,它使用预防医学、健康促进、环境卫生、社会科学等技术和手段。公共卫生体系由国际公共卫生组织、国家
  • 猴脑猴脑是亚洲珍贵的传统食材,八珍之一。猴脑据传多以生食,吃猴脑的餐桌中间开一洞,其大小恰好可穿进猴头。待猴头伸出桌面时,将活猴的头骨击碎,再淋上热油,用银勺挖出脑髓食用。然而
  • 全球商品链全球商品链(Global Commodity Chains,缩写 GCC),这一概念最早是由美国杜克大学格里芬教授提出了的,为商品链的研究,提供了系统性的分析。格里芬强调GCC有四个部分必须去注意:另外,商
  • 光雾臭蛙光雾臭蛙(学名:)为蛙科蛙属的两栖动物,是中国的特有物种。分布于四川等地。该物种的模式产地在四川光雾山。
  • 翁索内戈罗翁索内戈罗(印尼语:Wongsonegoro,1897年4月20日-1978年3月4日),已故印度尼西亚(印尼)政治人物,曾任印尼内政部长、司法部长、教育与文化部长,并于第一届阿里·沙斯特罗阿米佐约内阁在
  • 莱奥·本哈克莱奥·本哈克(Leo Beenhakker,1942年8月2日-)生于荷兰的鹿特丹,是国际著名的足球教练。任教的著名球队包括阿贾克斯、费耶诺德、皇家马德里及萨拉戈萨等,亦曾出任沙特阿拉伯和荷兰
  • 公共漏洞和暴露公共漏洞和暴露(英语:CVE, Common Vulnerabilities and Exposures)又称常见漏洞与披露,是一个与信息安全有关的数据库,收集各种信息安全弱点及漏洞并给予编号以便于公众查阅。此