剪枝

✍ dations ◷ 2025-05-20 14:31:29 #机器学习小作品,机器学习

剪枝(英语:pruning)是机器学习与搜索算法当中通过移除决策树中分辨能力较弱的部分而减小决策树大小的方法。剪枝降低了模型的复杂度,因此能够降低过拟合风险,从而降低泛化误差。

在决策树算法中,决策树过大会有过拟合的风险,从而在新样本上的泛化性能很差;决策树过小则无法从样本空间中获取重要的结构化信息。然而,由于很难判断新增一个额外的分裂结点能否显著降低误差,人们很难判断何时停止决策树的生长是恰当的。该问题被称为视界限制效应(英语:Horizon_effect)。一个通用的策略是让决策树一直生长,直到每个叶子结点都包含足够少量的样本,而后通过剪枝的方法,移除分辨能力较弱的结点。

剪枝应当在减小决策树大小的同时,保证交叉验证下的精度不降低。

相关

  • 拉提姆拉齐奥(拉丁语:Lătĭŭm)或被译作“拉丁姆”,是意大利中西部的一个区域,在那里罗马城建立并扩展至罗马帝国首都。 这里的居民在罗马王国被建立前使用的语言,即为拉丁文的前身。
  • 沃尔夫冈·莱昂哈德沃尔夫冈·莱昂哈德(德语:Wolfgang Leonhard 1921年4月16日-2014年8月17日)德国政治作家、苏联、东德、共产主义史学家,生于德国共产党家庭,母亲与为德国共产党创始人罗莎·卢森堡
  • 圣卡斯伯特教堂圣卡斯伯特教堂(英语:The Parish Church of St Cuthbert)是一座位于苏格兰爱丁堡的教区教堂,隶属爱丁堡长老会。教堂坐落于爱丁堡城区内的王子街西端,大致在洛锡安路(Lohian Road)
  • 大彗星风兰大彗星风兰乃一种生长于马达加斯加东岸低地之附生植物。于1822年被发现 。白至浅绿、星形而蜡质的花序开于每年六月至九月,祗在夜间散发类似百合花和烟草属植物 ,包含苯甲酸甲
  • 菲律宾总统菲律宾总统是菲律宾共和国的国家元首兼任政府首脑,负责领导菲律宾政府,包括内阁在内的行政部门,同时也是菲律宾军队的最高统帅。根据1987年通过的菲律宾宪法第7章第2节,总统候选
  • 257<< 250251252253254255256257258259>> 257是256与258之间的自然数。
  • 尼亚丰凯尼亚丰凯(法语:Niafunké),是马里的城镇,位于该国北部,由通布图区负责管辖,是尼亚丰凯省的首府,处于廷巴克图西南面250公里的尼日尔河上。坐标:15°55′52″N 3°59′24″W / 15.9311
  • UTF-16UTF-16是Unicode字符编码五层次模型的第三层:字符编码表(Character Encoding Form,也称为"storage format")的一种实现方式。即把Unicode字符集的抽象码位映射为16位长的整数(即
  • 赛缪尔·冯·普芬多夫赛缪尔·冯·普芬多夫(Samuel von Pufendorf,1632年-1694年),属古典自然法学派(Classical law-of-nature school)。1632年出身德国牧师家庭。1660年著《法学要论》。1661年于海森堡
  • 约翰·威廉·阿特金森约翰·威廉·阿特金森(英语:John William Atkinson,1923年12月31日-2003年10月27日)是一位美国心理学家,对人类 动机、成就和行为进行科学研究的先驱。他也是第二次世界大战退伍军