多元分类

✍ dations ◷ 2025-11-30 05:38:16 #分类算法,统计分类

在机器学习中,多元分类是将实例分配到多个(多于两个)类别中的其中一个(将实例分配到两个类别中的其中一个被称为二分类)。

显然,分类算法可以分为二分类和多分类两种,而多分类算法可以通过将其转化为多个二分类来实现。

需要注意的是,多分类不应和多标签分类相混淆:多标签分类可以为每个实例预测多个标签,即同一个实例可以同时被分配到多个类别。

这部分讨论将多分类问题转化为多个二分类问题的策略。

:182, 338 (或,OvA或OvR)策略需要为每一个类别分别建立一个唯一的二分类基分类器,属于此类的所有样本均为正例,其余的全部为负例。这一策略需要基分类器去产生一个实值置信度以供决策,而不仅仅是预测出一个类标签:只是预测出类标签可能会导致归类的不明确(可能有多个基分类器都预测为正例),以致于一个样本会被预测属于多个类别。:182

通过OvR方法使用二分类算法L建立多分类学习器,其伪代码表示如下:

当进行多分类时,需要将所有的二分类分类器应用于一个未知样本x,x的最终分类类别即为产生最大置信度的分类器所对应的标签k:

尽管这一策略很流行,但它是一个受到些许问题困扰的启发式算法。首先,不同分类器之间置信度分布可能不同,这些分类器各自输出的置信度之间不一定具有可比性。其次,即使一个多分类训练集的类别是均衡分布的,其所对应的二分类所看到的类别分布也是不均衡的,因为它们所看到的负例个数通常远多于正例个数(即类别不平衡问题)。:338

(OvO) 的转化中,对于一个K类多分类问题,训练 ( − 1) / 2 个二分类分类器;每一个二分类分类器从初始多分类训练集中收集其中两个类别的所有样本,并学习去区分这两个类别。在预测时,会有一个投票:所有 ( − 1) / 2 个二分类分类器被应用于一个未知样本,并且那个得到最多“+1”预测的类别会成为最终的多分类预测结果。:339

像OvR一样, OvO也受些许问题困扰:在它输入空间的一些区域会收到相同数目的投票。:183

相关

  • 诉诸断言诉诸断言(appeal to assertion)或(重复)断言证明(proof by (repeated) assertion),是不断声称自己的观点无误而不提供任何理据的作为。尽管从未提供任何理据,但实际上,透过不断地重复
  • 社团法人心动家族儿童青少年关怀协会社团法人台湾心动家族儿童青少年关怀协会(又称为心动家族)系一个于2015年1月向中华民国内政部申请且经核准成立的社会公益协会。旨在—以照顾家族概念为出发,来协助不专心过动
  • span class=nowrapInsub2/sub(SOsub4/sub)sub&g硫酸铟是铟的硫酸盐,化学式为In2(SO4)3。它是一种无机化合物,由铟、氧化铟或其碳酸盐和硫酸反应得到,制备过程中,硫酸需要过量,否则会生成难溶的碱式盐。硫酸铟可以以无水物、五
  • 硫酰胺硫酰胺(化学式:H2NSO2NH2),又名磺酰胺,是硫酸的二酰胺衍生物。由硫酰氯与氨反应制备。
  • 布尔什维克党布尔什维克(俄语:большевик),旧译布尔塞维克,在俄语中意为“多数派”,是俄国社会民主工党中的一个派别。布尔什维克派的领袖人物列宁认为,社会民主工党应该建立一个以少数
  • 法国航空航天法国航空航天公司(法语:Aérospatiale)曾称国家航空航天工业公司(法语:Société Nationale d'Industrie Aérospatiale,SNIAS)是一家总部位于巴黎十六区的法国国有航空航天制造商,
  • 铀化合物许多铀化合物是已知的,它和钍是最稳定且最易获得的锕系元素,并且是可在常规实验室中安全合法地大量研究的锕系元素。因此,它们的化学性质在锕系元素中研究得最多,因为它们的自热
  • 十二伊玛目列表什叶派系列 十二伊玛目派 穆罕默德 · 法蒂玛 · 及 十二伊玛目: 阿里 · 哈桑 · 侯赛因 萨贾德/宰因·阿比丁 · 巴基尔 · 萨迪克 卡齐姆 · 里达 · 塔基/贾瓦德 哈迪/
  • 蓟苦素蓟苦素(英文:cynicin;centaurin。化学名:Butanoic acid),主要有抗菌消炎、美白抗肿瘤的作用;经试验证明,具有抗菌作用,51~224μg/ml浓度下,对绿脓杆菌等8种菌株有抑制作用,对流产杆菌
  • 洛瓦兹·拉兹洛洛瓦兹·拉兹洛 (Lovász László, 国际音标: 1948年3月9日-) 是一位匈牙利数学家,主要以在组合数学中的贡献知名。他因此在1999年被授予沃尔夫数学奖和高德纳奖,在2010年被授