多元分类

✍ dations ◷ 2025-12-04 21:55:42 #分类算法,统计分类

在机器学习中,多元分类是将实例分配到多个(多于两个)类别中的其中一个(将实例分配到两个类别中的其中一个被称为二分类)。

显然,分类算法可以分为二分类和多分类两种,而多分类算法可以通过将其转化为多个二分类来实现。

需要注意的是,多分类不应和多标签分类相混淆:多标签分类可以为每个实例预测多个标签,即同一个实例可以同时被分配到多个类别。

这部分讨论将多分类问题转化为多个二分类问题的策略。

:182, 338 (或,OvA或OvR)策略需要为每一个类别分别建立一个唯一的二分类基分类器,属于此类的所有样本均为正例,其余的全部为负例。这一策略需要基分类器去产生一个实值置信度以供决策,而不仅仅是预测出一个类标签:只是预测出类标签可能会导致归类的不明确(可能有多个基分类器都预测为正例),以致于一个样本会被预测属于多个类别。:182

通过OvR方法使用二分类算法L建立多分类学习器,其伪代码表示如下:

当进行多分类时,需要将所有的二分类分类器应用于一个未知样本x,x的最终分类类别即为产生最大置信度的分类器所对应的标签k:

尽管这一策略很流行,但它是一个受到些许问题困扰的启发式算法。首先,不同分类器之间置信度分布可能不同,这些分类器各自输出的置信度之间不一定具有可比性。其次,即使一个多分类训练集的类别是均衡分布的,其所对应的二分类所看到的类别分布也是不均衡的,因为它们所看到的负例个数通常远多于正例个数(即类别不平衡问题)。:338

(OvO) 的转化中,对于一个K类多分类问题,训练 ( − 1) / 2 个二分类分类器;每一个二分类分类器从初始多分类训练集中收集其中两个类别的所有样本,并学习去区分这两个类别。在预测时,会有一个投票:所有 ( − 1) / 2 个二分类分类器被应用于一个未知样本,并且那个得到最多“+1”预测的类别会成为最终的多分类预测结果。:339

像OvR一样, OvO也受些许问题困扰:在它输入空间的一些区域会收到相同数目的投票。:183

相关

  • 视网膜色素变性视网膜色素变性,或称视网膜色素病变(Retinitis Pigmentosa,简称RP),是一种遗传性眼科疾病。初期普遍的病征是夜盲、视野变窄,可以看到正前方景物,但略偏左右的视野就无法看见,RP病人
  • 大卫·O·塞尔兹尼克大卫·O·塞尔兹尼克(David O. Selznick,1902年5月10日-1965年6月22日),生于美国匹兹堡,犹太人,美国电影业巨擘,《乱世佳人》的编剧,连续两年夺得奥斯卡最佳影片奖。他是好莱坞黄金时
  • 镰木见内文镰木(学名:Drepanophycus),又名镰蕨,是一属已灭绝的陆生维管植物,生存于古生代泥盆纪。它们和哈氏蕨属(英语:Halleophyton)有相似之处,和同时期与本属密切相关的巴拉曼蕨属反而
  • 披集府披集府(泰语:จังหวัดพิจิตร,皇家转写:Changwat Phichit,泰语发音:)是泰国北方的府,其府治为披集市,面积为4,531平方公里,2014年的人口有547,543人。与她相邻的府有:彭世洛
  • 波兰反犹太主义波兰犹太人的历史长达一个千禧年,既经历过漫长的宗教宽容时期,该国的犹太人群体繁荣昌盛;也在20世纪纳粹德国占领波兰期间,经历了犹太人大屠杀,整个群体几乎遭受了彻底的种族灭绝
  • 林达光林达光(1920年3月14日-2004年7月4日),出生于加拿大温哥华,加拿大华人,加拿大宋庆龄儿童基金会创办人。1943年获美国密歇根大学文学学士学位。1945年获哈佛大学国际法国际关系学硕
  • 札维耶·贾诺利札维耶·贾诺利(法语:Xavier Giannoli)是法国电影导演。札维耶·贾诺利曾以《我当歌手的日子(法语:Quand j'étais chanteur)》(2006)与《梦想高速公路(法语:À l'origine (film))》
  • 马赞德兰语马赞德兰语(مَزِروني),亦称:塔巴里语,属印度-伊朗语族西北伊朗语支,主要使用在伊朗马赞德兰省和戈勒斯坦省。与吉拉基语、扎扎其语,和俾路支语关系紧密。与波斯语也有较远的
  • 废名废名(1901年11月9日-1967年10月7日),本名冯文炳,湖北黄梅人。中国现代作家,学者。废名于1901年11月9日生于湖北黄梅,其家境殷实,然自幼多病。童年受传统私塾教育,13岁入黄梅八角亭初
  • 夏尔·德尔波特夏尔·德尔波特(法语:Charles Delporte,1893年3月11日-1960年),比利时男子击剑运动员。他曾获得1924年夏季奥运会击剑比赛男子重剑个人金牌和男子重剑团体银牌。他也参加了1920年