多元分类

✍ dations ◷ 2025-11-23 11:05:43 #分类算法,统计分类

在机器学习中,多元分类是将实例分配到多个(多于两个)类别中的其中一个(将实例分配到两个类别中的其中一个被称为二分类)。

显然,分类算法可以分为二分类和多分类两种,而多分类算法可以通过将其转化为多个二分类来实现。

需要注意的是,多分类不应和多标签分类相混淆:多标签分类可以为每个实例预测多个标签,即同一个实例可以同时被分配到多个类别。

这部分讨论将多分类问题转化为多个二分类问题的策略。

:182, 338 (或,OvA或OvR)策略需要为每一个类别分别建立一个唯一的二分类基分类器,属于此类的所有样本均为正例,其余的全部为负例。这一策略需要基分类器去产生一个实值置信度以供决策,而不仅仅是预测出一个类标签:只是预测出类标签可能会导致归类的不明确(可能有多个基分类器都预测为正例),以致于一个样本会被预测属于多个类别。:182

通过OvR方法使用二分类算法L建立多分类学习器,其伪代码表示如下:

当进行多分类时,需要将所有的二分类分类器应用于一个未知样本x,x的最终分类类别即为产生最大置信度的分类器所对应的标签k:

尽管这一策略很流行,但它是一个受到些许问题困扰的启发式算法。首先,不同分类器之间置信度分布可能不同,这些分类器各自输出的置信度之间不一定具有可比性。其次,即使一个多分类训练集的类别是均衡分布的,其所对应的二分类所看到的类别分布也是不均衡的,因为它们所看到的负例个数通常远多于正例个数(即类别不平衡问题)。:338

(OvO) 的转化中,对于一个K类多分类问题,训练 ( − 1) / 2 个二分类分类器;每一个二分类分类器从初始多分类训练集中收集其中两个类别的所有样本,并学习去区分这两个类别。在预测时,会有一个投票:所有 ( − 1) / 2 个二分类分类器被应用于一个未知样本,并且那个得到最多“+1”预测的类别会成为最终的多分类预测结果。:339

像OvR一样, OvO也受些许问题困扰:在它输入空间的一些区域会收到相同数目的投票。:183

相关

  • 病症人体解剖学 - 人体生理学 组织学 - 胚胎学 人体寄生虫学 - 免疫学 病理学 - 病理生理学 细胞学 - 营养学 流行病学 - 药理学 - 毒理学症状(英语:symptom)又称病状,医学术语,在疾
  • 现代埃及埃及现代史,始于1882年英军出兵埃及,协助埃及苏丹特费克镇压艾哈迈德·阿拉比的叛乱,之后继续留在埃及,虽然那时埃及名义上还属于奥斯曼帝国,但是实际上被英国控制。1914年埃及正
  • 卡罗琳·赫歇尔罗拉琳·卢克雷拉蒂娅·赫歇尔(德语:Caroline Lucretia Herschel,1750年3月16日-1848年1月9日),出生于德国汉诺威,德国天文学家,威廉·赫歇尔的妹妹。1772年,卡罗琳拉移居英国巴斯与
  • 花坛花坛可以指:
  • 天冬酰胺酶门冬酰胺酶(英语:Asparaginase,EC 3.5.1.1),又名天冬酰胺酶或天门冬酰胺酶,是一种催化天冬酰胺水解成天冬氨酸的酶。在自然界中,一些微生物能产生这种酶。不同类型的门冬酰胺酶被用
  • 产品设计工业设计(英语:Industrial Design)是以工学、美学、经济学为基础对工业产品进行的设计,它是20世纪初工业化社会的产物,其设计理念从产生之初的“形式随机能”发展到现今的“在符
  • 漏芦漏芦(学名:Stemmacantha uniflora)为菊科漏芦属下的一个种。
  • 克罗地亚广播电视台克罗地亚广播电视台(克罗地亚语:Hrvatska radiotelevizija / HRT)是克罗地亚的公共广播电视系统,提供广播和电视服务。在2011年,克罗地亚广播电视80%以上的收入来自收视费。每户
  • 白脾髄白髓,亦作白脾髓,是脾脏的一部分,与红脾髓一起构成脾脏的主要部分。白脾髓由马耳皮基氏脾小结及马耳皮基氏小体等腺体组织构成,外貌呈球型,包裹着小动脉。它的主要功能则为对抗外
  • 克劳斯·曼克劳斯·曼(Klaus Mann,1906年11月18日-1949年5月21日),是一位德国作家。克劳斯·曼出生于慕尼黑,是德国作家托马斯·曼和妻子卡提亚的儿子。他的父亲是路德教派信徒,而他的母亲来