多元分类

✍ dations ◷ 2025-06-29 14:32:47 #分类算法,统计分类

在机器学习中,多元分类是将实例分配到多个(多于两个)类别中的其中一个(将实例分配到两个类别中的其中一个被称为二分类)。

显然,分类算法可以分为二分类和多分类两种,而多分类算法可以通过将其转化为多个二分类来实现。

需要注意的是,多分类不应和多标签分类相混淆:多标签分类可以为每个实例预测多个标签,即同一个实例可以同时被分配到多个类别。

这部分讨论将多分类问题转化为多个二分类问题的策略。

:182, 338 (或,OvA或OvR)策略需要为每一个类别分别建立一个唯一的二分类基分类器,属于此类的所有样本均为正例,其余的全部为负例。这一策略需要基分类器去产生一个实值置信度以供决策,而不仅仅是预测出一个类标签:只是预测出类标签可能会导致归类的不明确(可能有多个基分类器都预测为正例),以致于一个样本会被预测属于多个类别。:182

通过OvR方法使用二分类算法L建立多分类学习器,其伪代码表示如下:

当进行多分类时,需要将所有的二分类分类器应用于一个未知样本x,x的最终分类类别即为产生最大置信度的分类器所对应的标签k:

尽管这一策略很流行,但它是一个受到些许问题困扰的启发式算法。首先,不同分类器之间置信度分布可能不同,这些分类器各自输出的置信度之间不一定具有可比性。其次,即使一个多分类训练集的类别是均衡分布的,其所对应的二分类所看到的类别分布也是不均衡的,因为它们所看到的负例个数通常远多于正例个数(即类别不平衡问题)。:338

(OvO) 的转化中,对于一个K类多分类问题,训练 ( − 1) / 2 个二分类分类器;每一个二分类分类器从初始多分类训练集中收集其中两个类别的所有样本,并学习去区分这两个类别。在预测时,会有一个投票:所有 ( − 1) / 2 个二分类分类器被应用于一个未知样本,并且那个得到最多“+1”预测的类别会成为最终的多分类预测结果。:339

像OvR一样, OvO也受些许问题困扰:在它输入空间的一些区域会收到相同数目的投票。:183

相关

  • 头足动物头足纲(学名:Cephalopoda)是软体动物门的一个纲。化石种在一万种以上,现仅存786种,主要是各类乌贼和章鱼。头足纲可分为两个到四个亚纲,其中现存两个亚纲。一个是蛸亚纲(Coleoidea)
  • 近自由电子近似近自由电子近似(英语:Nearly-free electron model)是一种研究电子的近似方法。依据能带理论,可以认为固体内部电子不再束缚在单个原子周围,而是在整个固体内部运动,仅仅受到离子实
  • 执政联盟澳大利亚政治上的联盟(英语:The Coalition)特指由澳大利亚自由党(及其前身政党)和澳大利亚国家党及其它关联地方性政党组成的右翼保守派联盟,又称自由党-国家党联盟(The Liberal-Na
  • 武汉理工大学武汉理工大学(简称:武理工,英语:Wuhan University of Technology,缩写:WUT),位于“九省通衢”的中国湖北省武汉市,为中华人民共和国教育部直属的全国重点大学,其历史追溯于1898年创立
  • 小阿肯色河小阿肯色河(英语:Little Arkansas River)是北美中央大平原上的一条河,是阿肯色河的一条支流,其全长123-英里(198-千米),位于美国堪萨斯州。
  • 咽喉咽喉(Throat)是解剖学中咽(学名:Pharynx)和喉(Larynx)的总称,是消化系统和呼吸系统的一部分。Template:Mouth anatomy(英语:Template:Mouth anatomy)
  • 晶种晶种是一小块单晶或多晶(通常是单晶),像种子般用来成长与自身相同材料、相同晶体结构的大晶体。无论把晶种浸入过饱和溶液,或使晶种与熔融材料接触并冷却,或者让材料蒸气在晶种表
  • 缪斯·比希·阿卜迪缪斯·比希·阿卜迪(索马里语:Muuse Bixi Cabdi;阿拉伯语:موسى بيحي عبدي‎,1948年-)是一位索马里政治家和前军官,自2017年12月以来一直担任索马里兰总统。20世纪70年代
  • 二乙基二硫代氨基甲酸钠二乙基二硫代氨基甲酸钠是一种有机硫化合物,化学式为NaS2CN(C2H5)2。这种盐可通过混合二硫化碳和二乙胺,并用氢氧化钠中和得到:其他的二硫代氨基甲酸盐也可以以相同的方式,通过
  • 古普鲁士人古普鲁士人或波罗的普鲁士人(德语:或,拉丁语:, 错误:{{lang-xx}}:文本有斜体标记(帮助), 错误:{{lang-xx}}:文本有斜体标记(帮助),波兰语:)是一个族群,是属于波罗的语族,居住在普鲁士地区的原住