多元分类

✍ dations ◷ 2025-12-08 14:47:58 #分类算法,统计分类

在机器学习中,多元分类是将实例分配到多个(多于两个)类别中的其中一个(将实例分配到两个类别中的其中一个被称为二分类)。

显然,分类算法可以分为二分类和多分类两种,而多分类算法可以通过将其转化为多个二分类来实现。

需要注意的是,多分类不应和多标签分类相混淆:多标签分类可以为每个实例预测多个标签,即同一个实例可以同时被分配到多个类别。

这部分讨论将多分类问题转化为多个二分类问题的策略。

:182, 338 (或,OvA或OvR)策略需要为每一个类别分别建立一个唯一的二分类基分类器,属于此类的所有样本均为正例,其余的全部为负例。这一策略需要基分类器去产生一个实值置信度以供决策,而不仅仅是预测出一个类标签:只是预测出类标签可能会导致归类的不明确(可能有多个基分类器都预测为正例),以致于一个样本会被预测属于多个类别。:182

通过OvR方法使用二分类算法L建立多分类学习器,其伪代码表示如下:

当进行多分类时,需要将所有的二分类分类器应用于一个未知样本x,x的最终分类类别即为产生最大置信度的分类器所对应的标签k:

尽管这一策略很流行,但它是一个受到些许问题困扰的启发式算法。首先,不同分类器之间置信度分布可能不同,这些分类器各自输出的置信度之间不一定具有可比性。其次,即使一个多分类训练集的类别是均衡分布的,其所对应的二分类所看到的类别分布也是不均衡的,因为它们所看到的负例个数通常远多于正例个数(即类别不平衡问题)。:338

(OvO) 的转化中,对于一个K类多分类问题,训练 ( − 1) / 2 个二分类分类器;每一个二分类分类器从初始多分类训练集中收集其中两个类别的所有样本,并学习去区分这两个类别。在预测时,会有一个投票:所有 ( − 1) / 2 个二分类分类器被应用于一个未知样本,并且那个得到最多“+1”预测的类别会成为最终的多分类预测结果。:339

像OvR一样, OvO也受些许问题困扰:在它输入空间的一些区域会收到相同数目的投票。:183

相关

  • 冰岛冰岛国家与大学图书馆(Landsbókasafn Íslands — Háskólabókasafn)是冰岛的国家图书馆,也是冰岛大学的大学图书馆。这座图书馆于1994年12月1日建立在首都雷克雅未克,由建立
  • 劳工劳动力可有以下含义:
  • C-17C-17“环球霸王III”(英语:C-17 Globemaster III)是美国麦道公司(现为波音)为美国空军研制生产的战略军用运输机,是同时具备战略战术空运能力于一身的短场起降(英语:Short Takeoff a
  • 第二共和国法兰西第二共和国,简称第二共和,是1848年11月4日到1852年12月2日间统治法国的共和政体。1848年法国二月革命爆发。二月革命成功后,七月王朝崩溃,资产阶级取得政权,建立了法兰西第
  • 辛酉辛酉为干支之一,顺序为第58个。前一位是庚申,后一位是壬戌。论阴阳五行,天干之辛属阴之金,地支之酉属阴之金,是比例和好。中国传统纪年农历的干支纪年中一个循环的第58年称“辛酉
  • 丹·布鲁耶特丹尼·雷·布鲁耶特(英语:Danny Ray Brouillette,1962年8月18日-),美国政治人物、商人,2019年12月1日起担任美国能源部长,2017年到2019年担任能源副部长(英语:United States Deputy Se
  • 青沼令子青沼令子(日语:青沼 令子/あおぬま れいこ ,1954年1月28日-),日本女子篮球运动员。她曾随日本国家队参加了1976年夏季奥林匹克运动会女子篮球比赛,最终队伍获得第五名。
  • 遮断机遮断机,俗称栅栏,是一种用以暂时阻挡车辆的装置。最常见于平交道、行人过路区(确保火车优先通过)、收费站、停车场出入口、公家机关入口或口岸等处。一组遮断机可以区分为遮断
  • 吴道镕吴道镕(1852年-1936年5月18日),原名国镇,字玉臣,号用晦,晚号澹庵,祖籍浙江会稽,寄籍广东番禺。吴道镕于光绪六年(1880年)中庚辰科进士,同年五月,改翰林院庶吉士。光绪十二年四月,散馆,授翰
  • 潘念之潘念之(1902年-1988年),浙江新昌人,中国当代法学家。潘念之1924年加入中国共产党。潘念之先后担任共青团宁波书记和上海闸北区团委委员、国民党浙江常务委员兼组织部长、浙江政务