多元分类

✍ dations ◷ 2025-12-11 00:40:33 #分类算法,统计分类

在机器学习中,多元分类是将实例分配到多个(多于两个)类别中的其中一个(将实例分配到两个类别中的其中一个被称为二分类)。

显然,分类算法可以分为二分类和多分类两种,而多分类算法可以通过将其转化为多个二分类来实现。

需要注意的是,多分类不应和多标签分类相混淆:多标签分类可以为每个实例预测多个标签,即同一个实例可以同时被分配到多个类别。

这部分讨论将多分类问题转化为多个二分类问题的策略。

:182, 338 (或,OvA或OvR)策略需要为每一个类别分别建立一个唯一的二分类基分类器,属于此类的所有样本均为正例,其余的全部为负例。这一策略需要基分类器去产生一个实值置信度以供决策,而不仅仅是预测出一个类标签:只是预测出类标签可能会导致归类的不明确(可能有多个基分类器都预测为正例),以致于一个样本会被预测属于多个类别。:182

通过OvR方法使用二分类算法L建立多分类学习器,其伪代码表示如下:

当进行多分类时,需要将所有的二分类分类器应用于一个未知样本x,x的最终分类类别即为产生最大置信度的分类器所对应的标签k:

尽管这一策略很流行,但它是一个受到些许问题困扰的启发式算法。首先,不同分类器之间置信度分布可能不同,这些分类器各自输出的置信度之间不一定具有可比性。其次,即使一个多分类训练集的类别是均衡分布的,其所对应的二分类所看到的类别分布也是不均衡的,因为它们所看到的负例个数通常远多于正例个数(即类别不平衡问题)。:338

(OvO) 的转化中,对于一个K类多分类问题,训练 ( − 1) / 2 个二分类分类器;每一个二分类分类器从初始多分类训练集中收集其中两个类别的所有样本,并学习去区分这两个类别。在预测时,会有一个投票:所有 ( − 1) / 2 个二分类分类器被应用于一个未知样本,并且那个得到最多“+1”预测的类别会成为最终的多分类预测结果。:339

像OvR一样, OvO也受些许问题困扰:在它输入空间的一些区域会收到相同数目的投票。:183

相关

  • 凯旋级核潜艇凯旋级核潜艇(法语:Classe Le Triomphant)是法国海军现役的弹道导弹核潜艇,共有4艘,分别于1997、1999、2004及2010年服役。四艘核潜艇取代原有的六艘可畏级核潜艇,成为法国核慑力
  • 食肉目食肉目(学名:Carnivora)在动物分类学上是哺乳纲中的一个目。食肉目包括260多种胎生的动物。除杂食的熊科(比如主要吃竹叶的大熊猫),绝大部分均在不同程度上以其他鸟兽、两栖类、爬
  • 北纬纬度(φ)是地球表面一个点的南北地理位置的表示法。纬度与经度通常一起使用以确定地表上某点的精确位置。纬度是一个角度,其范围从赤道的0度到南北极的90度。在英文文本中,纬度
  • 太上太上老君,简称老君,全称“一炁化三清太清居火赤天仙登太清境玄气所成日神宝君道德天尊混元上帝”,又称“太上混元老君、梵形神宝玄真降生道德天尊”,又称道德天尊、混元老君等。
  • 法国共和历法国共和历(法语:calendrier républicain“共和历”)或称法国大革命历法(calendrier révolutionnaire français),中文简称法国历,是法兰西第一共和国时期的革命历法,在法国大革命
  • 气体扩散法气体扩散法是一种利用不同分子间在热运动中具有不同的速度而分离出铀235的富集(浓缩)方法。两种不同分子质量的气体混合物在热平衡时拥有相同的平均动能,相对速度与分子量成反
  • 磷酸铅磷酸铅,是一种有毒的铅化合物,尽管目前仍是人类可疑致癌物,但EPA对动物进行的测试已认定其是动物致癌物。 当加热时,该化合物分解,生成有毒的铅和磷的氧化物。磷酸铅可通过呼吸道
  • 扰动位扰动位(英语:Disturbing potential),也称异常位(英语:Anomalous potential),指地球的真实重力位与正常重力位之间的差异。:82扰动位是建立地球重力场模型过程中的关键变量,与大地水准
  • 熟悉的陌生人《熟悉的陌生人》(英语:),是一首由澳大利亚/比利时双重国籍歌手高堤耶演唱的歌曲,由高堤耶本人创作并录制,而新西兰歌手/吉他手金贝拉参与了歌曲伴唱。歌曲于2011年7月5日由Eleven
  • 天竺葵属约230余种:等天竺葵属(学名:),别名石腊红、入腊红、日烂红、洋葵,属牻牛儿苗科,是开花植物的一个属,包括约230种多年生肉质、亚灌木或灌木植物。天竺葵原产非洲南部,世界各地普遍栽培