多元分类

✍ dations ◷ 2025-12-11 14:42:51 #分类算法,统计分类

在机器学习中,多元分类是将实例分配到多个(多于两个)类别中的其中一个(将实例分配到两个类别中的其中一个被称为二分类)。

显然,分类算法可以分为二分类和多分类两种,而多分类算法可以通过将其转化为多个二分类来实现。

需要注意的是,多分类不应和多标签分类相混淆:多标签分类可以为每个实例预测多个标签,即同一个实例可以同时被分配到多个类别。

这部分讨论将多分类问题转化为多个二分类问题的策略。

:182, 338 (或,OvA或OvR)策略需要为每一个类别分别建立一个唯一的二分类基分类器,属于此类的所有样本均为正例,其余的全部为负例。这一策略需要基分类器去产生一个实值置信度以供决策,而不仅仅是预测出一个类标签:只是预测出类标签可能会导致归类的不明确(可能有多个基分类器都预测为正例),以致于一个样本会被预测属于多个类别。:182

通过OvR方法使用二分类算法L建立多分类学习器,其伪代码表示如下:

当进行多分类时,需要将所有的二分类分类器应用于一个未知样本x,x的最终分类类别即为产生最大置信度的分类器所对应的标签k:

尽管这一策略很流行,但它是一个受到些许问题困扰的启发式算法。首先,不同分类器之间置信度分布可能不同,这些分类器各自输出的置信度之间不一定具有可比性。其次,即使一个多分类训练集的类别是均衡分布的,其所对应的二分类所看到的类别分布也是不均衡的,因为它们所看到的负例个数通常远多于正例个数(即类别不平衡问题)。:338

(OvO) 的转化中,对于一个K类多分类问题,训练 ( − 1) / 2 个二分类分类器;每一个二分类分类器从初始多分类训练集中收集其中两个类别的所有样本,并学习去区分这两个类别。在预测时,会有一个投票:所有 ( − 1) / 2 个二分类分类器被应用于一个未知样本,并且那个得到最多“+1”预测的类别会成为最终的多分类预测结果。:339

像OvR一样, OvO也受些许问题困扰:在它输入空间的一些区域会收到相同数目的投票。:183

相关

  • 中世纪前期(又称中世纪早期、中古早期;英语:Early Middle Ages)是在欧洲历史上,自西罗马帝国灭亡后,从500年到1000年间大约5个世纪的一个时期,前承后古典时代、后接中世纪中期。在
  • 省水花园省水花园,是园林绿化和园艺,减少或省去了用水灌溉需求。省水花园可替代各类传统园艺不具备的方便,丰富,或可靠的淡水的需求。在一些地区,诸如节水型景观、耐旱园林、绿化。省水花
  • 法兰西斯·高尔顿弗朗西斯·高尔顿爵士,FRS(英语:Sir Francis Galton,1822年2月16日-1911年1月17日),英格兰维多利亚时代的博学家、人类学家、优生学家、热带探险家、地理学家、发明家、气象学家、
  • 二氢尿嘧啶二氢尿嘧啶(英语:Dihydrouracil)是尿嘧啶分解代谢的中间产物之一,能与核糖通过C-N糖苷键组成的二氢尿苷,在RNA中能与腺嘌呤形成互补配对。医学导航:遗传代谢缺陷代谢、k,c/g/r/p/y
  • 米歇尔·法伊弗米歇尔·法伊弗(英语:Michelle Pfeiffer,1958年4月29日-),美国著名电影女演员,2007年并当选“好莱坞形象巡回代表”。成名作为1983年的《疤面人》(Scarface),最知名作品是1992年电影《
  • 美国总统就职典礼美国总统就职典礼的举行,标志着新一届美国总统任期的开始。实际上,美国宪法中对就职典礼所规定的唯一一项,就是在总统进入总统办公室执政前,必须进行宣誓。然而随着历史的推移,就
  • 穆罕默德·乌尔德·阿卜杜勒-阿齐兹穆罕默德·乌尔德·阿卜杜勒-阿齐兹(阿拉伯语:محمد ولد عبد العزيز‎ ;1956年12月20日-),毛里塔尼亚前任总统。1956年,生于毛塔因希里省首府阿克茹特。2005年8月参
  • 秀英街道秀英街道是中国海南省海口市秀英区下辖的一个街道。秀英街道下辖秀华社区、秀海社区、秀中社区、秀新社区、书场社区和向荣村。
  • 星野仙一选手监督星野仙一(日语:星野 仙一、1947年1月22日-2018年1月4日),前日本职棒中日龙选手,退休后曾经担任过中日龙、阪神虎队监督,2011年担任东北乐天金鹰监督。26 渡边直人 | 73 野
  • F9F黑豹战斗机F9F黑豹(英语:F9F Panther)是格鲁曼所生产的第一架喷射式战斗机,同时也是美国海军航空母舰上成功布署的喷射式舰载战斗轰炸机之一。黑豹是韩战中最广泛使用的美国海军战斗机,一共