多元分类

✍ dations ◷ 2025-12-05 16:48:47 #分类算法,统计分类

在机器学习中,多元分类是将实例分配到多个(多于两个)类别中的其中一个(将实例分配到两个类别中的其中一个被称为二分类)。

显然,分类算法可以分为二分类和多分类两种,而多分类算法可以通过将其转化为多个二分类来实现。

需要注意的是,多分类不应和多标签分类相混淆:多标签分类可以为每个实例预测多个标签,即同一个实例可以同时被分配到多个类别。

这部分讨论将多分类问题转化为多个二分类问题的策略。

:182, 338 (或,OvA或OvR)策略需要为每一个类别分别建立一个唯一的二分类基分类器,属于此类的所有样本均为正例,其余的全部为负例。这一策略需要基分类器去产生一个实值置信度以供决策,而不仅仅是预测出一个类标签:只是预测出类标签可能会导致归类的不明确(可能有多个基分类器都预测为正例),以致于一个样本会被预测属于多个类别。:182

通过OvR方法使用二分类算法L建立多分类学习器,其伪代码表示如下:

当进行多分类时,需要将所有的二分类分类器应用于一个未知样本x,x的最终分类类别即为产生最大置信度的分类器所对应的标签k:

尽管这一策略很流行,但它是一个受到些许问题困扰的启发式算法。首先,不同分类器之间置信度分布可能不同,这些分类器各自输出的置信度之间不一定具有可比性。其次,即使一个多分类训练集的类别是均衡分布的,其所对应的二分类所看到的类别分布也是不均衡的,因为它们所看到的负例个数通常远多于正例个数(即类别不平衡问题)。:338

(OvO) 的转化中,对于一个K类多分类问题,训练 ( − 1) / 2 个二分类分类器;每一个二分类分类器从初始多分类训练集中收集其中两个类别的所有样本,并学习去区分这两个类别。在预测时,会有一个投票:所有 ( − 1) / 2 个二分类分类器被应用于一个未知样本,并且那个得到最多“+1”预测的类别会成为最终的多分类预测结果。:339

像OvR一样, OvO也受些许问题困扰:在它输入空间的一些区域会收到相同数目的投票。:183

相关

  • 杨耀东杨耀东,金韵奖歌手,妻子为崔爱莲(崔苔菁之妹,1958-2001.10.3,因气喘离世)。
  • 铁路利用本列表资料分别列出铁路货运及客运之资料。下表列出每年延吨公里超过10亿的国家,若无其他注记,资料均来自国际铁路联盟铁路统计2014年报告下表列出每年货运量1000万吨以上的国
  • 硝酸根离子硝酸盐是一个多原子离子其分子式NO3−和分子量62.0049克/mol。硝酸盐同样描述为有机官能团RONO2。这些硝酸酯是一专业炸药。CP#3是硝酸根离子NO3−形成的盐。许多金属都能形
  • 东人党东人党,是朝鲜王朝宣祖时的两班朋党。是后来士林派朋党始祖。由1575年存在至1591年。1567年宣祖即位起用新人,勋旧派不再有影响力。1575年两个士林派首领,金孝元与沈义谦开始斗
  • 鸬鹚见内文鸬鹚科(学名:Phalacrocoracidae)是鸟纲鲣鸟目的一科,其下包括鸬鹚属(学名:Phalacrocorax)、小鸬鹚属(学名:Microcarbo)及蓝眼鸬鹚属(学名:Leucocarbo)三属。特征为足部4趾相连全蹼
  • 乙型冠状病毒1型乙型冠状病毒1型(Betacoronavirus 1、β1CoV)是乙型冠状病毒属的一个种,包含多种病毒,分别可感染人类、牛与猪等动物,造成人类普通感冒的人类冠状病毒OC43即属于乙型冠状病毒1型
  • 科纳斯组织科纳斯组织(Khronos Group)是一个由成员资助的,专注于制定开放标准(Open standard)的行业协会,重点制定免费的API,使在各种平台和设备上创作或播放的多媒体可以得到硬件加速。所有K
  • 世界童军大露营世界童军大露营(法语:Jamboree Scout Mondial)为国际间童军大露营的一种,通常有数千甚至数以万计来自世界各地十四至十七岁之青年参与。第1次世界童军大露营由伦敦英国童军总会
  • 喷泉 (杜尚)《喷泉》(英语:Fountain)又译为《清泉》,是美籍法裔艺术家马塞尔·杜尚于1917年创作的作品,这也是他称为“现成物(英语:Found object)”的系列作品(英语:Readymades of Marcel Duchamp
  • 离子飞机离子飞机(Ionic plane、Ionocraft)是指由电流产生离子风来作为推力或拉力的飞机。这种电动飞机不同于以往的飞机,它没有螺旋桨、没有涡轮机,由带电空气分子碰撞而成的“离子风”