多元分类

✍ dations ◷ 2025-12-09 11:55:56 #分类算法,统计分类

在机器学习中,多元分类是将实例分配到多个(多于两个)类别中的其中一个(将实例分配到两个类别中的其中一个被称为二分类)。

显然,分类算法可以分为二分类和多分类两种,而多分类算法可以通过将其转化为多个二分类来实现。

需要注意的是,多分类不应和多标签分类相混淆:多标签分类可以为每个实例预测多个标签,即同一个实例可以同时被分配到多个类别。

这部分讨论将多分类问题转化为多个二分类问题的策略。

:182, 338 (或,OvA或OvR)策略需要为每一个类别分别建立一个唯一的二分类基分类器,属于此类的所有样本均为正例,其余的全部为负例。这一策略需要基分类器去产生一个实值置信度以供决策,而不仅仅是预测出一个类标签:只是预测出类标签可能会导致归类的不明确(可能有多个基分类器都预测为正例),以致于一个样本会被预测属于多个类别。:182

通过OvR方法使用二分类算法L建立多分类学习器,其伪代码表示如下:

当进行多分类时,需要将所有的二分类分类器应用于一个未知样本x,x的最终分类类别即为产生最大置信度的分类器所对应的标签k:

尽管这一策略很流行,但它是一个受到些许问题困扰的启发式算法。首先,不同分类器之间置信度分布可能不同,这些分类器各自输出的置信度之间不一定具有可比性。其次,即使一个多分类训练集的类别是均衡分布的,其所对应的二分类所看到的类别分布也是不均衡的,因为它们所看到的负例个数通常远多于正例个数(即类别不平衡问题)。:338

(OvO) 的转化中,对于一个K类多分类问题,训练 ( − 1) / 2 个二分类分类器;每一个二分类分类器从初始多分类训练集中收集其中两个类别的所有样本,并学习去区分这两个类别。在预测时,会有一个投票:所有 ( − 1) / 2 个二分类分类器被应用于一个未知样本,并且那个得到最多“+1”预测的类别会成为最终的多分类预测结果。:339

像OvR一样, OvO也受些许问题困扰:在它输入空间的一些区域会收到相同数目的投票。:183

相关

  • 诉讼诉讼(lawsuit;suit in law)),是一种法律行动,分为民事和刑事两类,前者原诉人是受害者当事人,因为有未可解决的争议,所以诉诸法律。后者涉及刑事犯罪,由政府当局控告疑犯(提起公诉)。诉
  • 给吕萨克约瑟夫·路易·盖-吕萨克(法语:Joseph Louis Gay-Lussac,1778年12月6日-1850年5月10日),法国化学家和物理学家,以研究气体而闻名。盖-吕萨克出生于法国上维埃纳省的圣利奥纳德,并在
  • 种类疫苗是用细菌、病毒、肿瘤细胞等制成的可使机体产生特异性免疫的生物制剂,通过疫苗接种使接受方获得免疫力。英语中,疫苗一词“vaccine”源自于爱德华·金纳所使用的牛痘。“v
  • 萨拉·罗斯福萨拉·安·德拉诺·罗斯福(Sara Ann Delano Roosevelt,1854年9月21日 - 1941年9月7日),美国德拉诺家族成员,老詹姆斯·罗斯福的妻子,美国总统富兰克林·D·罗斯福的母亲。出口控制
  • 九年一贯课程九年一贯课程为台湾教育改革主要政策之一,亦为该改革中最重要一环。以中华民国教育部为主导机关的该教育改革政策,乃指将台湾境内国民小学与国民中学两学校层级课程中的科目与
  • 英国美洲殖民地英国美洲殖民地 (包括英格兰和苏格兰(英语:Scottish colonization of the Americas)的殖民地)始于1607年弗吉尼亚州的詹姆斯镇,并在全美洲建立殖民地时达到颠峰。英国是美洲最大的
  • 谍影重重4《谍影重重4:伯恩的遺產》(英语:The Bourne Legacy)是一部于2012年上映的美国动作惊悚电影,改编自罗伯特·勒德伦的著名小说。托尼·吉尔罗伊执导,并继续由托尼·吉尔罗伊编剧。本
  • 马鲁古马鲁古省或摩鹿加省(印尼语:Provinsi Maluku;英语:Moluccas Province)是印度尼西亚东部的一个省,辖境包括马鲁古群岛的中部和南部。首府和主要城市是位于安汶岛上的安汶。2010年普
  • 硝酸三氧铼硝酸三氧铼是一种无机化合物,化学式为ReO3NO3。硝酸三氧铼可由氯化三氧铼和五氧化二氮反应得到:七氧化二铼和五氧化二氮的硝基甲烷饱和溶液反应,也能得到硝酸三氧铼。
  • 塞缪尔·柯尔特塞缪尔·柯尔特(英语:Samuel Colt,1814年7月19日-1862年1月10日)美国发明家和实业家,他是美国柯尔特制造公司(英语:Colt's Manufacturing Company)的创始人,他的发明使得左轮手枪进入