多元分类

✍ dations ◷ 2025-10-26 05:42:51 #分类算法,统计分类

在机器学习中,多元分类是将实例分配到多个(多于两个)类别中的其中一个(将实例分配到两个类别中的其中一个被称为二分类)。

显然,分类算法可以分为二分类和多分类两种,而多分类算法可以通过将其转化为多个二分类来实现。

需要注意的是,多分类不应和多标签分类相混淆:多标签分类可以为每个实例预测多个标签,即同一个实例可以同时被分配到多个类别。

这部分讨论将多分类问题转化为多个二分类问题的策略。

:182, 338 (或,OvA或OvR)策略需要为每一个类别分别建立一个唯一的二分类基分类器,属于此类的所有样本均为正例,其余的全部为负例。这一策略需要基分类器去产生一个实值置信度以供决策,而不仅仅是预测出一个类标签:只是预测出类标签可能会导致归类的不明确(可能有多个基分类器都预测为正例),以致于一个样本会被预测属于多个类别。:182

通过OvR方法使用二分类算法L建立多分类学习器,其伪代码表示如下:

当进行多分类时,需要将所有的二分类分类器应用于一个未知样本x,x的最终分类类别即为产生最大置信度的分类器所对应的标签k:

尽管这一策略很流行,但它是一个受到些许问题困扰的启发式算法。首先,不同分类器之间置信度分布可能不同,这些分类器各自输出的置信度之间不一定具有可比性。其次,即使一个多分类训练集的类别是均衡分布的,其所对应的二分类所看到的类别分布也是不均衡的,因为它们所看到的负例个数通常远多于正例个数(即类别不平衡问题)。:338

(OvO) 的转化中,对于一个K类多分类问题,训练 ( − 1) / 2 个二分类分类器;每一个二分类分类器从初始多分类训练集中收集其中两个类别的所有样本,并学习去区分这两个类别。在预测时,会有一个投票:所有 ( − 1) / 2 个二分类分类器被应用于一个未知样本,并且那个得到最多“+1”预测的类别会成为最终的多分类预测结果。:339

像OvR一样, OvO也受些许问题困扰:在它输入空间的一些区域会收到相同数目的投票。:183

相关

  • 最小对立体最小对立体(minimal pair)在音韵学中,指的是在某个语言中一对字词,这对字词的音韵元素,例如语音、音位、声调、时位(chroneme),只有一处相异,而有不同的词意。这个概念可以用来说明某
  • 耶利哥耶利哥或耶律哥(希伯来语:.mw-parser-output .script-hebrew,.mw-parser-output .script-Hebr{font-size:1.15em;font-family:"Ezra SIL","Ezra SIL SR","Keter Aram Tsova","
  • 东盟卫视东盟卫视(MGTV)是一家服务于东盟十国的华语电视台,其总部位于泰国曼谷。秉持传播中国形象、弘扬中华文化为宗旨,致力于促进中国与东盟各国的经济、旅游与文化交流,以推动东盟一体
  • 摩托罗拉摩托罗拉公司(英语:Motorola, Inc.)是一间总部位于美国绍姆堡的电信设备制造商。2011年,摩托罗拉拆分成两家独立的公司——摩托罗拉移动及摩托罗拉系统。摩托罗拉的业务包括设计
  • 少数族群少数民族,是实行主体民族与少数民族区别对待政策的国家的差别用语,是民族主义国家中主体民族以外的民族群体,人口比例占少数。少数民族可以是原住民族,也可以是外来民族,来源真实
  • 古斯塔夫·哈特劳布卡雷尔·约翰·古斯塔夫·哈特劳布(德语:Karel Johan Gustav Hartlaub,1814年11月8日-1900年11月29日)是一位德国医生与鸟类学家。哈特劳布出生于不来梅,学生时期住于波昂与柏林,并
  • 古诗古诗有两种含义:
  • 彼得·布莱克尔彼得·布莱克尔(荷兰语:Pieter Bleeker,1819年7月10日-1878年1月24日)生于海牙,荷兰医师、鱼类学家,以研究东亚鱼类而闻名。他曾于1842年至1860年期间在荷属东印度皇家陆军中担任医
  • 时乐濛时乐濛(1915年12月10日-2008年6月16日),男,河南伊川人,中国作曲家,曾任中国音乐家协会副主席、中国轻音乐学会主席、解放军艺术学院副院长、总政歌舞团团长等职。1915年12月10日,时
  • 原子实原子实(core或atomic kernel),物理学界又称之为“原子芯”,是一个应用越来越广泛的概念。在书写电子排布式时,通常把内层电子已达到稀有气体结构的部分写成稀有气体的元素符号外