多元分类

✍ dations ◷ 2025-11-26 02:20:23 #分类算法,统计分类

在机器学习中,多元分类是将实例分配到多个(多于两个)类别中的其中一个(将实例分配到两个类别中的其中一个被称为二分类)。

显然,分类算法可以分为二分类和多分类两种,而多分类算法可以通过将其转化为多个二分类来实现。

需要注意的是,多分类不应和多标签分类相混淆:多标签分类可以为每个实例预测多个标签,即同一个实例可以同时被分配到多个类别。

这部分讨论将多分类问题转化为多个二分类问题的策略。

:182, 338 (或,OvA或OvR)策略需要为每一个类别分别建立一个唯一的二分类基分类器,属于此类的所有样本均为正例,其余的全部为负例。这一策略需要基分类器去产生一个实值置信度以供决策,而不仅仅是预测出一个类标签:只是预测出类标签可能会导致归类的不明确(可能有多个基分类器都预测为正例),以致于一个样本会被预测属于多个类别。:182

通过OvR方法使用二分类算法L建立多分类学习器,其伪代码表示如下:

当进行多分类时,需要将所有的二分类分类器应用于一个未知样本x,x的最终分类类别即为产生最大置信度的分类器所对应的标签k:

尽管这一策略很流行,但它是一个受到些许问题困扰的启发式算法。首先,不同分类器之间置信度分布可能不同,这些分类器各自输出的置信度之间不一定具有可比性。其次,即使一个多分类训练集的类别是均衡分布的,其所对应的二分类所看到的类别分布也是不均衡的,因为它们所看到的负例个数通常远多于正例个数(即类别不平衡问题)。:338

(OvO) 的转化中,对于一个K类多分类问题,训练 ( − 1) / 2 个二分类分类器;每一个二分类分类器从初始多分类训练集中收集其中两个类别的所有样本,并学习去区分这两个类别。在预测时,会有一个投票:所有 ( − 1) / 2 个二分类分类器被应用于一个未知样本,并且那个得到最多“+1”预测的类别会成为最终的多分类预测结果。:339

像OvR一样, OvO也受些许问题困扰:在它输入空间的一些区域会收到相同数目的投票。:183

相关

  • 色散力伦敦色散力(London dispersion force, LDF),简称伦敦力或色散力,是一作用于分子间的力。它是范德华力的一部分,名称源自德裔美国物理学家弗里兹·伦敦(英语:Fritz London)。科学家观
  • 纳斯达克纳斯达克股票交易所(英语:NASDAQ,i/ˈnæzˌdæk/)是美国的一间电子股票交易所,创立于1971年,是现在世界上第二大的证券交易所。其英文名称“NASDAQ”原为National Association of
  • 斜张桥斜拉桥(Cable-stayed bridge),又称斜张桥,是指一种由一或多座桥塔与钢缆组成来拉起桥面的桥梁。斜拉桥主要可分为两大类型,以钢缆与主塔连接的方式区分。斜拉桥可分为单塔斜拉桥
  • 19691969年欧洲歌唱大赛(Gran Premio de la Canción de Eurovision 1969)为欧洲歌唱大赛之第14届比赛,于1969年5月29日在西班牙马德里的马德里皇家歌剧院举行,本次大赛结果遇到一个
  • 南极毛皮海狮南极毛皮海狮(学名:Arctocephalus gazella)又叫南极海狗,主要分布于南极洲水域,其中约95%生活在南乔治亚岛和南桑威奇群岛。它的学名来源于第一艘捕捉到它的德国船SMS Gazelle。
  • 韦丛芜韦丛芜(1905年3月16日-1978年12月19日),原名崇武,号立人、若愚,笔名东滢、蓼南、白菜、力行等,安徽霍邱叶集人,中国诗人、翻译家、政治人物,曾于20世纪30年代在其家乡开展“全国合作
  • Rivals.comRivals.com是一间以大学美式足球及篮球为主的网站,该网站始于1998年,现有超过300名员工。对于大学球员的评价有一定的参考性。个别学校的官网可以在这里看到包括的联赛:
  • NHK宫崎放送局NHK宫崎放送局,是日本放送协会位于宫崎县宫崎市的地方放送局,也是负责主管当地事务的放送局。
  • B6B6(原名楼南立,1981年-)是一名中国的电子音乐家,音乐制作人及平面设计师。他在2000年创立独立音乐厂牌Isolation Music;在2006年作为创始人之一成立艺术创意公司Neocha。同年B6还
  • 钟蕊钟蕊(英语:Isabel Zhong,1992年5月18日-),美国女子羽毛球运动员、演员、歌手和模特儿。钟蕊于秘鲁利马出生,小时候就随家人移民到美国南加利福尼亚州。2002年,她代表美国参加泛美洲