C4.5算法

✍ dations ◷ 2025-04-02 19:17:02 #分类算法,决策树

C4.5算法是由Ross Quinlan(英语:Ross Quinlan)开发的用于产生决策树的算法。该算法是对Ross Quinlan之前开发的ID3算法的一个扩展。C4.5算法产生的决策树可以被用作分类目的,因此该算法也可以用于统计分类。

C4.5算法与ID3算法一样使用了信息熵的概念,并和ID3一样通过学习数据来建立决策树。

在Springer LNCS于2008年发表的优秀论文中,该算法在前10大数据挖掘算法中排名第一,之后使得它变得非常受欢迎。

C4.5跟ID3一样,使用信息熵从训练数据集中构建决策树。训练数据是已经分类的样本集合 S = s 1 , s 2 , . . . {\displaystyle S={s_{1},s_{2},...}} 。每个样本 s i {\displaystyle s_{i}} 由p维向量 ( x 1 , i , x 2 , i , . . . , x p , i ) {\displaystyle (x_{1,i},x_{2,i},...,x_{p,i})} 组成,其中 x j {\displaystyle x_{j}} 表示样本的属性值或者叫特征,当然也包括样本 s i {\displaystyle s_{i}} 的类别。

在树的每个节点上,C4.5选择数据的属性,该属性最有效地将其样本集划分为集中在一个类或另一个类中的子集。划分准则是归一化的信息增益,即熵的差。选择信息增益最大的属性进行决策,然后对划分后的子集进行递归处理。

该算法有几个基本情况:

构建决策树的一般算法是:

相关

  • 化学特性化学性质是物质在化学反应中表现出来的特征及性质。
  • span style=color:#ffffff;地理/span希腊位于欧洲东南角,巴尔干半岛南端。其北面与阿尔巴尼亚、北马其顿共和国和保加利亚毗邻,西临爱奥尼亚海,南靠地中海,东靠爱琴海与小亚细亚。希腊国土面积为131940平方千米,由希
  • 高通CDMA芯片 BREW Eudora OmniTRACS MediaFLOSnapdragon处理器高通公司(英语:Qualcomm,NASDAQ:QCOM)是一个位于美国加州圣地亚哥的无线电通信技术研发公司,由加州大学圣地亚哥分校教
  • 大东舆地图大东舆地图(谚文:대동여지도)是朝鲜王朝地理学家金正浩于1861年绘制的朝鲜半岛地图。其基本图纸的比例尺为1:162000,将朝鲜全境按纬线划分为22个部分,将其一个部分作为一册。一册
  • 脑部大出血颅内出血(ICH)是头部颅骨内出血。这种情况可能导致血液或血块压迫到脑神经造成脑神经坏死。颅内出血包含:脑室内出血(英语:intraventricular bleed)和脑实质性出血(英语:intraparenc
  • 2019冠状病毒病疫苗SARS-CoV-2(病毒)国际运输2019冠状病毒病疫苗是一种尚处在试验阶段的针对2019冠状病毒病(COVID-19)的疫苗。目前已经有多种研发这种疫苗的尝试正在进行,尽管暂时没有疫苗完成临床
  • SYNGAP18831240057ENSG00000227460、ENSG00000197283ENSMUSG00000067629Q96PV0F6SEU4NM_006772、NM_001130066NM_001281491、XM_006524235、XM_006524236、XM_006524237、XM_006524
  • 威利斯·李第二次世界大战小威利斯·奥古斯塔斯·李(英语:Willis Augustus Lee, Jr.,1888年5月11日-1945年8月25日)海军中将,1920年安特卫普奥运美国男子射击队成员之一,第二次世界大战时美国
  • 冬狮《冬狮》(英语:The Lion in Winter)是一套1968年首映的英国古装剧情片,由安东尼·夏菲执导,彼得·奥图尔、凯瑟琳·赫本、安东尼·霍普金斯及蒂莫西·道尔顿等主演。电影改编自詹
  • 齐夫拉·乔治齐夫拉·乔治(匈牙利语:Cziffra György,法语:Georges Cziffra,1921年11月5日-1994年1月15日),法国匈牙利裔钢琴家、作曲家。齐夫拉·乔治的父亲是个曾在巴黎表演钦巴龙(英语:Cimbalom