多元分类

✍ dations ◷ 2025-11-25 01:38:59 #分类算法,统计分类

在机器学习中,多元分类是将实例分配到多个(多于两个)类别中的其中一个(将实例分配到两个类别中的其中一个被称为二分类)。

显然,分类算法可以分为二分类和多分类两种,而多分类算法可以通过将其转化为多个二分类来实现。

需要注意的是,多分类不应和多标签分类相混淆:多标签分类可以为每个实例预测多个标签,即同一个实例可以同时被分配到多个类别。

这部分讨论将多分类问题转化为多个二分类问题的策略。

:182, 338 (或,OvA或OvR)策略需要为每一个类别分别建立一个唯一的二分类基分类器,属于此类的所有样本均为正例,其余的全部为负例。这一策略需要基分类器去产生一个实值置信度以供决策,而不仅仅是预测出一个类标签:只是预测出类标签可能会导致归类的不明确(可能有多个基分类器都预测为正例),以致于一个样本会被预测属于多个类别。:182

通过OvR方法使用二分类算法L建立多分类学习器,其伪代码表示如下:

当进行多分类时,需要将所有的二分类分类器应用于一个未知样本x,x的最终分类类别即为产生最大置信度的分类器所对应的标签k:

尽管这一策略很流行,但它是一个受到些许问题困扰的启发式算法。首先,不同分类器之间置信度分布可能不同,这些分类器各自输出的置信度之间不一定具有可比性。其次,即使一个多分类训练集的类别是均衡分布的,其所对应的二分类所看到的类别分布也是不均衡的,因为它们所看到的负例个数通常远多于正例个数(即类别不平衡问题)。:338

(OvO) 的转化中,对于一个K类多分类问题,训练 ( − 1) / 2 个二分类分类器;每一个二分类分类器从初始多分类训练集中收集其中两个类别的所有样本,并学习去区分这两个类别。在预测时,会有一个投票:所有 ( − 1) / 2 个二分类分类器被应用于一个未知样本,并且那个得到最多“+1”预测的类别会成为最终的多分类预测结果。:339

像OvR一样, OvO也受些许问题困扰:在它输入空间的一些区域会收到相同数目的投票。:183

相关

  • 减毒病毒疫苗减毒活病毒(英语:attenuated virus,又译弱化病毒)是指致病性被削弱的病毒,这些病毒在毒性降低的同时,仍保有活性,也就是并未被杀死。制造这类病毒的主要目的是为了生产疫苗。与其相
  • 全美第9名这里有三个列表是有关美国各州的,它们分别以总面积、陆地面积和水域面积排列。所有的这些数据来源于美国人口调查局,2000年。请参看:美国各州人口列表、美国各州首府列表总面积
  • 5f14 6d7 7s2(计算值)2, 8, 18, 32, 32, 15, 2(预测)第一:800.8(估值) kJ·mol−1 第二:1823.6(估值) kJ·mol−1 第三:2904.2(估值) kJ·mol−1 (主条目:鿏的同位素鿏(Meitnerium)是人工
  • 约翰·哥特弗雷德·赫尔德约翰·戈特弗里德·赫尔德(德语:Johann Gottfried Herder,姓或译赫德;1744年8月25日-1803年12月18日),德国哲学家、路德派神学家、诗人。其作品《论语言的起源》(德语:Abhandlung üb
  • 第七届立法院的多数立委中华民国立法院第七届委员在民国97年(2008年)元月12日选出,任期自民国97年(2008年)2月1日至民国101年(2012年)元月31日止。本届立法院之席次总计113席,包括区域立法委员73席、原住民
  • 己型肝炎己型肝炎又称F型肝炎(Hepatitis F),1994年由Deka等人报告提出。当时认为是非甲、非乙、非丙、非戊型的新型肝炎。后已确认为一种遗传变异的乙肝病毒。
  • 低磷酸酯脢症低磷酸酯脢症是一种遗传病,其会导致磷酸酯脢活性过低,使矿物质化作用异常,骨骼和牙齿会造成钙或磷等异常堆积。患者骨骼变软、强度变弱,与佝偻症相似。四肢显得短小、胸腔轮廓亦
  • 十八蝴蝶十八蝴蝶是一种中国浙江省永康市的传统舞蹈,2008年列入中国国家级非物质文化遗产。十八蝴蝶起源于原永康县高镇村,由民间艺人王春山于1946年结合放风筝的民俗与舞蹈创制,被村民
  • 各国铋产量列表这是一个2006年各国铋产量列表,基于英国地质调查所2008年6月的数据。
  • .jo.jo为约旦国家及地区顶级域(ccTLD)的域名,于1997年推出。此外还拥有阿拉伯语顶级域名الاردن.‎。A .ac .ad .ae .af .ag .ai .al .am .ao .aq .ar .as .at .au .aw .ax