多元分类

✍ dations ◷ 2025-04-03 13:01:30 #分类算法,统计分类

在机器学习中,多元分类是将实例分配到多个(多于两个)类别中的其中一个(将实例分配到两个类别中的其中一个被称为二分类)。

显然,分类算法可以分为二分类和多分类两种,而多分类算法可以通过将其转化为多个二分类来实现。

需要注意的是,多分类不应和多标签分类相混淆:多标签分类可以为每个实例预测多个标签,即同一个实例可以同时被分配到多个类别。

这部分讨论将多分类问题转化为多个二分类问题的策略。

:182, 338 (或,OvA或OvR)策略需要为每一个类别分别建立一个唯一的二分类基分类器,属于此类的所有样本均为正例,其余的全部为负例。这一策略需要基分类器去产生一个实值置信度以供决策,而不仅仅是预测出一个类标签:只是预测出类标签可能会导致归类的不明确(可能有多个基分类器都预测为正例),以致于一个样本会被预测属于多个类别。:182

通过OvR方法使用二分类算法L建立多分类学习器,其伪代码表示如下:

当进行多分类时,需要将所有的二分类分类器应用于一个未知样本x,x的最终分类类别即为产生最大置信度的分类器所对应的标签k:

尽管这一策略很流行,但它是一个受到些许问题困扰的启发式算法。首先,不同分类器之间置信度分布可能不同,这些分类器各自输出的置信度之间不一定具有可比性。其次,即使一个多分类训练集的类别是均衡分布的,其所对应的二分类所看到的类别分布也是不均衡的,因为它们所看到的负例个数通常远多于正例个数(即类别不平衡问题)。:338

(OvO) 的转化中,对于一个K类多分类问题,训练 ( − 1) / 2 个二分类分类器;每一个二分类分类器从初始多分类训练集中收集其中两个类别的所有样本,并学习去区分这两个类别。在预测时,会有一个投票:所有 ( − 1) / 2 个二分类分类器被应用于一个未知样本,并且那个得到最多“+1”预测的类别会成为最终的多分类预测结果。:339

像OvR一样, OvO也受些许问题困扰:在它输入空间的一些区域会收到相同数目的投票。:183

相关

  • 鼻中隔软骨鼻中隔软骨(英语:septal nasal cartilage)是由透明软骨(英语:hyaline cartilage)所组成。某些地方看起来像四边形,其边缘比中间还要厚实。鼻中隔软骨把前面鼻腔的中间部分给分成左
  • 欧仁·德拉克罗瓦欧仁·德拉克罗瓦(法语:Eugène Delacroix,1798年4月26日—1863年8月13日)是法国著名浪漫主义画家。1798年4月26日出生于法国瓦勒德马恩省,曾师从法国古典主义画派画家皮埃尔-纳
  • 离子注入离子注入是一种将特定离子在电场里加速,然后嵌入到另一固体材料之中的技术手段。使用这个技术可以改变固体材料的物理化学性质,现在已经广泛应用于半导体器件制造和某些材料科
  • 意译意译(sense-for-sense translation)是通过换句话,重述一个文本或段落。“Sense-for-sense translation”的另一个术语是paraphrase。“Sense-for-sense translation”不同于“f
  • 周志鑫周志鑫(1965年8月-),安徽省太湖县人,中华人民共和国空间遥感应用专家,中国人民解放军少将,中国科学院信息技术科学部院士。1982年毕业于安徽省太湖中学。1982年至1986年在中国人民
  • 沪昆客运专线.mw-parser-output .RMbox{box-shadow:0 2px 2px 0 rgba(0,0,0,.14),0 1px 5px 0 rgba(0,0,0,.12),0 3px 1px -2px rgba(0,0,0,.2)}.mw-parser-output .RMinline{float:none
  • 彩原园彩原 园(あやはら その,5月14日- )是日本的漫画家,长野县安昙野市出身。在《Ribon漫画学校》2005年1月号以获得准Ribon奖的作品《ネコゴコロ》出道。
  • 欲望都市《欲望都市:电影版》(英语:)是2008年的一部浪漫喜剧电影,剧情内容是HBO知名影集《欲望都市》的延伸,讲述住在纽约市的四位女性好友感情后续发展的故事。全球首映会在2008年5月12日
  • 大卫·林奇大卫·林奇(英语:David Lynch,1946年1月20日-)为美国电影电视导演、编剧、制片人、作曲家及摄影家。其电影作品风格诡异,多带有迷幻色彩,属于超现实主义。大卫·林奇已经入围3次奥
  • 诺曼·斯通诺曼·斯通(英语:Norman Stone,1941年3月8日-2019年6月19日),英国历史学家,牛津大学教授,剑桥大学教授,撒切尔首相政府顾问,欧亚研究中心成员,亚美尼亚种族大屠杀否认者。1941年出生在