多元分类

✍ dations ◷ 2025-12-07 09:08:11 #分类算法,统计分类

在机器学习中,多元分类是将实例分配到多个(多于两个)类别中的其中一个(将实例分配到两个类别中的其中一个被称为二分类)。

显然,分类算法可以分为二分类和多分类两种,而多分类算法可以通过将其转化为多个二分类来实现。

需要注意的是,多分类不应和多标签分类相混淆:多标签分类可以为每个实例预测多个标签,即同一个实例可以同时被分配到多个类别。

这部分讨论将多分类问题转化为多个二分类问题的策略。

:182, 338 (或,OvA或OvR)策略需要为每一个类别分别建立一个唯一的二分类基分类器,属于此类的所有样本均为正例,其余的全部为负例。这一策略需要基分类器去产生一个实值置信度以供决策,而不仅仅是预测出一个类标签:只是预测出类标签可能会导致归类的不明确(可能有多个基分类器都预测为正例),以致于一个样本会被预测属于多个类别。:182

通过OvR方法使用二分类算法L建立多分类学习器,其伪代码表示如下:

当进行多分类时,需要将所有的二分类分类器应用于一个未知样本x,x的最终分类类别即为产生最大置信度的分类器所对应的标签k:

尽管这一策略很流行,但它是一个受到些许问题困扰的启发式算法。首先,不同分类器之间置信度分布可能不同,这些分类器各自输出的置信度之间不一定具有可比性。其次,即使一个多分类训练集的类别是均衡分布的,其所对应的二分类所看到的类别分布也是不均衡的,因为它们所看到的负例个数通常远多于正例个数(即类别不平衡问题)。:338

(OvO) 的转化中,对于一个K类多分类问题,训练 ( − 1) / 2 个二分类分类器;每一个二分类分类器从初始多分类训练集中收集其中两个类别的所有样本,并学习去区分这两个类别。在预测时,会有一个投票:所有 ( − 1) / 2 个二分类分类器被应用于一个未知样本,并且那个得到最多“+1”预测的类别会成为最终的多分类预测结果。:339

像OvR一样, OvO也受些许问题困扰:在它输入空间的一些区域会收到相同数目的投票。:183

相关

  • 收复失地运动基督徒:穆斯林:Kingdom of Portugal:收复失地运动(西班牙语、葡萄牙语:Reconquista,意为“重新征服”),亦称为复国运动、复地运动,是718至1492年间(安达卢斯或阿拉伯殖民西班牙的时期
  • 宋真宗宋真宗赵恒(968年12月23日-1022年3月23日),原名赵德昌,又曾名赵元休、赵元侃,北宋的第三位皇帝。他是宋太宗的第三个儿子,登基前曾被封为韩王、襄王和寿王,淳化五年(994年)九月,加检校
  • 脊椎椎间盘炎脊椎椎间盘炎(英语:spondylodiscitis)是指同时合并椎间盘炎(一节或是多节的椎间盘发炎)和脊椎炎(一节或是多节的椎骨发炎),后者通常会侵犯相邻的椎间盘间隙。脊椎椎间盘炎是败血症
  • 施密尔舒苏联国防人民委员部反间谍总局(俄语:Главное управление контрразведки СМЕРШ Народного комиссариата оборо
  • 弗洛期弗洛期(Floian)是奥陶纪的第二个阶段,年代大约位于477.7–470百万年前。
  • 高山樗牛高山樗牛(1871年2月28日-1902年12月28日)原名高山林次郎,出生于大日本帝国时期的山形县鹤冈市,毕业于东京帝国大学,日本近代知名作家。高山樗牛的父亲是一个藩士,幼年时他就做了伯
  • 慢性疲劳症候群慢性疲劳(倦)症候群(英语:chronic fatigue syndrome, CFS、myalgic encephalomyelitis (ME)),又称为肌痛性脑脊髓炎(myalgic encephalomyelitis),(脊髓炎是有争议的,另一种说法为可
  • 2,3,5-三甲基-1,4-苯醌2,3,5-三甲基-1,4-苯醌是一种有机化合物,化学式为C9H10O2。它可由2,3,5-三甲基苯酚被弗氏盐氧化得到。它是维生素E与2,3,5-三甲基-1,4-苯二酚合成过程中的重要中间体。
  • 巴伐利亚王后奥地利-埃斯特的玛丽亚·特蕾莎奥地利-埃斯特的玛丽亚·特蕾西亚·亨丽埃特·多萝西(英语:Maria Theresa of Austria-Este,1849年7月2日-1919年2月3日),巴伐利亚王后。她是奥地利-埃斯特的斐迪南大公和奥地利的
  • 陈洪谟陈洪谟(1476年-1527年),字宗禹,湖广武陵县人,明朝政治人物。弘治丙辰进士。嘉靖年间官至兵部侍郎。弘治九年(1496年)丙辰科进士,授刑部主事。正德五年(1510年)任福建漳州府知府,有惠政。