多元分类

✍ dations ◷ 2025-12-08 07:03:32 #分类算法,统计分类

在机器学习中,多元分类是将实例分配到多个(多于两个)类别中的其中一个(将实例分配到两个类别中的其中一个被称为二分类)。

显然,分类算法可以分为二分类和多分类两种,而多分类算法可以通过将其转化为多个二分类来实现。

需要注意的是,多分类不应和多标签分类相混淆:多标签分类可以为每个实例预测多个标签,即同一个实例可以同时被分配到多个类别。

这部分讨论将多分类问题转化为多个二分类问题的策略。

:182, 338 (或,OvA或OvR)策略需要为每一个类别分别建立一个唯一的二分类基分类器,属于此类的所有样本均为正例,其余的全部为负例。这一策略需要基分类器去产生一个实值置信度以供决策,而不仅仅是预测出一个类标签:只是预测出类标签可能会导致归类的不明确(可能有多个基分类器都预测为正例),以致于一个样本会被预测属于多个类别。:182

通过OvR方法使用二分类算法L建立多分类学习器,其伪代码表示如下:

当进行多分类时,需要将所有的二分类分类器应用于一个未知样本x,x的最终分类类别即为产生最大置信度的分类器所对应的标签k:

尽管这一策略很流行,但它是一个受到些许问题困扰的启发式算法。首先,不同分类器之间置信度分布可能不同,这些分类器各自输出的置信度之间不一定具有可比性。其次,即使一个多分类训练集的类别是均衡分布的,其所对应的二分类所看到的类别分布也是不均衡的,因为它们所看到的负例个数通常远多于正例个数(即类别不平衡问题)。:338

(OvO) 的转化中,对于一个K类多分类问题,训练 ( − 1) / 2 个二分类分类器;每一个二分类分类器从初始多分类训练集中收集其中两个类别的所有样本,并学习去区分这两个类别。在预测时,会有一个投票:所有 ( − 1) / 2 个二分类分类器被应用于一个未知样本,并且那个得到最多“+1”预测的类别会成为最终的多分类预测结果。:339

像OvR一样, OvO也受些许问题困扰:在它输入空间的一些区域会收到相同数目的投票。:183

相关

  • 心血运动论《心血运动论》(拉丁语:Exercitatio Anatomica de Motu Cordis et Sanguinis in Animalibus),全称《关于动物心脏与血液运动的解剖研究》,是英国生理学家、胚胎学家威廉·哈维于1
  • 亚实基拿亚实基拿(希伯来语:.mw-parser-output .script-hebrew,.mw-parser-output .script-Hebr{font-size:1.15em;font-family:"Ezra SIL","Ezra SIL SR","Keter Aram Tsova","Taamey
  • 阿片受体阿片样肽受体或阿片类受体、阿片受体(英语:Opioid receptors)是一类以阿片样肽为配体的G蛋白偶联受体。内源性类阿片物质包括强啡肽、脑啡肽(英语:enkephalin)、内啡肽、endomorph
  • 年代学年代学(英语:Chronology)是确定历史事件发生时间的科学。根据发生时间顺序从最早到最近或者相反的顺序排列一系列事件的列表叫做年表(或者历史年表),而这种记录历史的体裁叫做编年
  • 滕汝骏滕汝骏(1946年-),中国大陆影视演员。1999年凭借电影《那山、那人、那狗》获得中国电影金鸡奖最佳男主角。1994 胡亚捷 2001 张国立 2008 张涵予 2015 秦昊1995 牛振华 2002
  • 巨济岛事件巨济岛事件,是指朝鲜战争期间,美军在巨济岛上建立战俘营(英语:Geoje prison camp)的一段历史。1951年11月,美军在韩国第二大岛巨济岛,建立了当时世界上最大的战俘营——巨济岛战俘
  • 泰诺 (药品)泰诺(英语:Tylenol,/ˈtaɪlənɒl/)是一个镇痛药药品品牌,该药品可以减缓发热和减轻过敏、感冒、咳嗽、头痛和感冒等症状。泰诺最初的有效成分是对乙酰氨基酚,常见于镇痛药和解热
  • 透明软骨透明软骨(Hyaline cartilage)是三种软骨组织中的一种,由软骨细胞与细胞外基质组成。因新鲜的透明软骨组织是半透明的,故名“透明软骨”。人体中三种软骨以透明软骨占比最大。人
  • 哈拉尔德·弗里奇哈拉尔德·弗里奇(德语:Harald Fritzsch,1943年2月10日-),德国理论物理学家和科普作家,研究基本粒子,是量子色动力学的奠基人之一,在夸克理论和量子色动力学发展方面作出了重要贡献。
  • 长齿锯齿鳗长齿锯犁鳗,又称长齿锯齿鳗,为辐鳍鱼纲鳗鲡目锯齿鳗科的其中一个种。本鱼分布于太平洋及印度洋温带至热带的中层水域。水深300至3200米。本鱼无胸鳍,后鼻孔开在眼前中线。鳃被