多元分类

✍ dations ◷ 2025-04-02 12:27:12 #分类算法,统计分类

在机器学习中,多元分类是将实例分配到多个(多于两个)类别中的其中一个(将实例分配到两个类别中的其中一个被称为二分类)。

显然,分类算法可以分为二分类和多分类两种,而多分类算法可以通过将其转化为多个二分类来实现。

需要注意的是,多分类不应和多标签分类相混淆:多标签分类可以为每个实例预测多个标签,即同一个实例可以同时被分配到多个类别。

这部分讨论将多分类问题转化为多个二分类问题的策略。

:182, 338 (或,OvA或OvR)策略需要为每一个类别分别建立一个唯一的二分类基分类器,属于此类的所有样本均为正例,其余的全部为负例。这一策略需要基分类器去产生一个实值置信度以供决策,而不仅仅是预测出一个类标签:只是预测出类标签可能会导致归类的不明确(可能有多个基分类器都预测为正例),以致于一个样本会被预测属于多个类别。:182

通过OvR方法使用二分类算法L建立多分类学习器,其伪代码表示如下:

当进行多分类时,需要将所有的二分类分类器应用于一个未知样本x,x的最终分类类别即为产生最大置信度的分类器所对应的标签k:

尽管这一策略很流行,但它是一个受到些许问题困扰的启发式算法。首先,不同分类器之间置信度分布可能不同,这些分类器各自输出的置信度之间不一定具有可比性。其次,即使一个多分类训练集的类别是均衡分布的,其所对应的二分类所看到的类别分布也是不均衡的,因为它们所看到的负例个数通常远多于正例个数(即类别不平衡问题)。:338

(OvO) 的转化中,对于一个K类多分类问题,训练 ( − 1) / 2 个二分类分类器;每一个二分类分类器从初始多分类训练集中收集其中两个类别的所有样本,并学习去区分这两个类别。在预测时,会有一个投票:所有 ( − 1) / 2 个二分类分类器被应用于一个未知样本,并且那个得到最多“+1”预测的类别会成为最终的多分类预测结果。:339

像OvR一样, OvO也受些许问题困扰:在它输入空间的一些区域会收到相同数目的投票。:183

相关

  • D06BB(Antifungals for dermatological use)(Emollients and protectives)(Preparations for treatment of wounds and ulcers)(Antipruritics, including antihistamines, anesthetics,
  • 头孢克洛头孢克洛(英语:Cefaclor),商品名如希克劳,是第二代头孢类抗生素,用来治疗由细菌感染导致的症状如肺炎,化学名(6R,7R)-7--3-氯-8-氧代-5-硫杂-1-氮杂双环辛-2-烯-2-甲酸,化学式C15H14
  • 传统宗教仪式:神明秘密社会:气是中国哲学、道教和中医学中常见的概念。中国历史春秋战国时代的思想家,将气的概念抽象化,成为天地一切事物组成的基本元素,有着像气体般的流动特性
  • 恋爱DNA研究所X《恋爱DNA研究所X》(韩语:연애 DNA 연구소-X,英语: ),为韩国MBN电视台于2019年推出的综艺节目,由尹施允、BOOM、秀彬、郑素谭、申奉仙、MC Gree等人共同主持,节目主轴为帮助尽管表
  • .mw-parser-output ruby.zy{text-align:justify;text-justify:none}.mw-parser-output ruby.zy>rp{user-select:none}.mw-parser-output ruby.zy>rt{font-feature-settings:
  • 奥林匹克运动会奥林匹克运动会(希腊语:Ολυμπιακοί Αγώνες、法语:Jeux olympiques、英语:Olympic Games),简称奥运会、奥运,是国际目前最高等级的综合型体育赛事,由国际奥林匹克委
  • 航天史自康斯坦丁·齐奥尔科夫斯基及罗伯特·戈达德在航天的理论方面给实际方面作出突破后,航天便在20世纪开始成为人类对成就的一项指标。苏联在战后太空竞赛中扮演领导者的角色,成
  • 太平洋法郎太平洋法郎 (简称为法郎)是法属波利尼西亚、新喀里多尼亚和瓦利斯和富图纳的流通货币。货币编号XPF。太平洋法郎与欧元之间采取固定汇率,1太平洋法郎=0.00838欧元。
  • 西瓜雪西瓜雪(英语:Watermelon snow)又称作“雪藻”,是一种具有微红或者粉红颜色并带有新鲜西瓜气味的雪。西瓜雪融化之后颜色更红,像红葡萄酒的颜色。这种类型的雪常在晚春或者夏季的
  • 德国湖泊列表德国湖泊列表按照面积罗列了德国境内主要的湖泊和水库。其中,面积最大、湖水最深的是博登湖,部分湖面在奥地利和瑞士境内。