多元分类

✍ dations ◷ 2025-12-05 04:21:27 #分类算法,统计分类

在机器学习中,多元分类是将实例分配到多个(多于两个)类别中的其中一个(将实例分配到两个类别中的其中一个被称为二分类)。

显然,分类算法可以分为二分类和多分类两种,而多分类算法可以通过将其转化为多个二分类来实现。

需要注意的是,多分类不应和多标签分类相混淆:多标签分类可以为每个实例预测多个标签,即同一个实例可以同时被分配到多个类别。

这部分讨论将多分类问题转化为多个二分类问题的策略。

:182, 338 (或,OvA或OvR)策略需要为每一个类别分别建立一个唯一的二分类基分类器,属于此类的所有样本均为正例,其余的全部为负例。这一策略需要基分类器去产生一个实值置信度以供决策,而不仅仅是预测出一个类标签:只是预测出类标签可能会导致归类的不明确(可能有多个基分类器都预测为正例),以致于一个样本会被预测属于多个类别。:182

通过OvR方法使用二分类算法L建立多分类学习器,其伪代码表示如下:

当进行多分类时,需要将所有的二分类分类器应用于一个未知样本x,x的最终分类类别即为产生最大置信度的分类器所对应的标签k:

尽管这一策略很流行,但它是一个受到些许问题困扰的启发式算法。首先,不同分类器之间置信度分布可能不同,这些分类器各自输出的置信度之间不一定具有可比性。其次,即使一个多分类训练集的类别是均衡分布的,其所对应的二分类所看到的类别分布也是不均衡的,因为它们所看到的负例个数通常远多于正例个数(即类别不平衡问题)。:338

(OvO) 的转化中,对于一个K类多分类问题,训练 ( − 1) / 2 个二分类分类器;每一个二分类分类器从初始多分类训练集中收集其中两个类别的所有样本,并学习去区分这两个类别。在预测时,会有一个投票:所有 ( − 1) / 2 个二分类分类器被应用于一个未知样本,并且那个得到最多“+1”预测的类别会成为最终的多分类预测结果。:339

像OvR一样, OvO也受些许问题困扰:在它输入空间的一些区域会收到相同数目的投票。:183

相关

  • 剧情片剧情片(drama film)指以故事剧情为主题的电影,是其中一种片种。剧情片一般长度在30分钟或以上,以电影院作为发放对像。相对于其他片种如动作片或爱情片以动作或爱情带动故事的推
  • 梁父吟梁父吟,又称梁甫吟,是中国古代流传于山东梁父山一带的民谣,汉代被收为乐府诗,作者无名氏,内容记述春秋时代齐国宰相晏婴以权谋帮助齐景公铲除功高震主三大功臣的故事。据说三国时
  • 工人自治工人自治是指在工作场所内由雇员自己进行工作上的决策,即工人通过民主方式管理企业等生产资料,与传统上由部门主管负责决策的做法有所分别。例子包括在西班牙内战期间的西班牙
  • 有机钠化学有机钠化学是研究含有碳-钠键的金属有机化合物(即有机钠化合物)化学的学科。 有机钠化合物的应用因为与有机锂化合物(同样位于元素周期表IA族)竞争而收到部分限制。尽管如此仍存
  • 皇太弟皇太弟,储君的一种,简称太弟,与皇太子、皇太孙、皇太叔等,都是皇帝正式继承人的封号,而此一继承人通常是皇帝的亲弟。不少国家历史上都曾出现皇太弟的封号,必须注意的是,如果国家元
  • 渭南市杜桥中学渭南高级中学位于中国陕西省渭南市临渭区杜化路,是渭南市临渭区教育局管辖的高级中学,也是陕西省普通高中示范性学校。学校建于1958年,占地50025平方米,建筑面积27673平方米。2
  • 法兰西斯·杜德法兰西斯‧汤森‧杜德(Francis Townsend Dodd,1899年10月5日-1973年)是美国陆军准将,由于韩战期间担任联合国军巨济岛战俘集中营指挥官时,在一次战俘暴动中遭朝鲜人民军战俘绑架为
  • 涂普义涂普义(法语:Jean Dupuis,1828年12月7日-1912年11月28日),又译堵布益、让·迪皮伊,法国商人、探险家。涂普义出生在圣瑞斯拉庞迪埃,曾在罗纳省塔拉尔接受教育。1858年,他作为一个商人
  • 范镇 (文学家)范镇(1009年-1089年1月15日),字景仁,华阳(今四川成都)人,北宋文学家、史学家。四岁既孤,从二兄范镃、范锴为学,又尝受学于乡先生庞直温,由范镃推荐跟随薛奎入京。薛奎预言范镇:“当以文
  • 毛肇宗毛肇宗,字克敬,浙江山阴县(在今浙江省绍兴市境)人。明朝政治人物、进士。永乐二年,中进士三甲第十一名。后授周王府教授,工诗,有《耶溪集》。