VC维

✍ dations ◷ 2025-05-19 14:34:08 #维度,统计分类

在VC理论中,VC维(Vapnik-Chervonenkis Dimension,由Vladimir Vapnik与Alexey Chervonenkis提出)是对一个可学习分类函数空间的能力(复杂度,表示能力等)的衡量。它定义为算法能“打散”的点集的势的最大值。直观地,一个分类模型的能力与其复杂程度相关。例如,考虑一个高次多项式的分类模型:若函数值大于0则分类为正,反之则分类为负。高次多项式能够“摆动”的范围很大,所以能够很好地拟合给定的点集。当然因此,这样的模型也很可能会在其他符合原点集趋势的点集上分类错误。我们说这一多项式是高能力的。如果考虑一个简单的线性分类模型,就不一定能够很好地拟合给定的点集。

给定一集合族 H {\displaystyle H} 为如下的集合族:

H C := { h C | h H } {\displaystyle H\cap C:=\{h\cap C\vert h\in H\}}

H {\displaystyle H} 能打散 C {\displaystyle C} ,当且仅当 H C {\displaystyle H\cap C} 包含 C {\displaystyle C} 的所有子集,即

| H C | = 2 | C | {\displaystyle \vert H\cap C\vert =2^{\vert C\vert }}

H {\displaystyle H} 的VC维定义为能被 H {\displaystyle H} 打散的势最大的集合的势。

对一个参数记为 θ {\displaystyle \theta } 的分类模型 f {\displaystyle f} ,称模型 f {\displaystyle f} 能够打散一点集 X = { x 1 , x 2 , , x n } {\displaystyle X=\{x_{1},x_{2},\cdots ,x_{n}\}} ,当且仅当对任意标签集 Y { 1 , + 1 } n {\displaystyle Y\in \{-1,+1\}^{n}} 都存在参数 θ {\displaystyle \theta ^{*}} 使得 f θ {\displaystyle f_{\theta ^{*}}} ( X , Y ) {\displaystyle (X,Y)} 上分类完全正确。

模型 f {\displaystyle f} 的VC维定义为能被 f {\displaystyle f} 打散的势最大的点集的势,或等价地,满足存在 X {\displaystyle X} | X | = D {\displaystyle \vert X\vert =D} 使得 f {\displaystyle f} 能打散 X {\displaystyle X} 的最大的 D {\displaystyle D}

相关

  • CD62选择素(英语:selectins,又译为选择蛋白,或称为表面抗原分化簇-62,即CD62)是一个细胞粘附分子CAM家族,包括有E-选择素、L 选择素、P选择素等。所有的选择素都是单链跨膜糖蛋白,与C-型
  • 翼手目蝙蝠,又名.mw-parser-output ruby.zy{text-align:justify;text-justify:none}.mw-parser-output ruby.zy>rp{user-select:none}.mw-parser-output ruby.zy>rt{font-feature-s
  • 地天地天(梵语:Pṛthvī),又称坚牢地神、坚牢神、持地神,即主掌大地之神,为十二天之一。最初为印度神话中养育万物的地母神颇哩提毗(Prithvi),后被佛教吸收,在南传佛教中也叫帕媚托拉尼,有
  • 丙戌丙戌为干支之一,顺序为第23个。前一位是乙酉,后一位是丁亥。论阴阳五行,天干之丙属阳之火,地支之戌属阳之土,是火生土相生。中国传统纪年农历的干支纪年中一个循环的第23年称“丙
  • SM EntertainmentSM娱乐(韩语:SM엔터테인먼트;英语:SM Entertainment)是由歌手出身的李秀满于1995年创办的一间韩国大型娱乐公司,其名称是由“Star Museum”缩写而来,与JYP娱乐、YG娱乐并称为韩国三
  • 灶头灶、炉灶、厨灶或灶头是一种固定的烹饪的设施,透过加热炊具来达到将食物变熟的目的。中文语境中有时也以灶来指窑,例如佛山的南风古灶。早期的灶多是粘土制灶的,用柴火来加热。
  • 奥兰多 (佛罗里达州)奥兰多(英语:Orlando)是位于美国佛罗里达州中部的一座城市,也是橙县(又译奥兰治县)的县治所在,根据美国人口调查局2006年统计,人口共220,186人。2016年3月都会区已上升至2,387,138人
  • 打纤打纤,又称勾芡、着膩、加滋,一种烹调方法。可以使食物色味更佳。做法是用各种淀粉加凉水搅匀的液汁,加进食材之中,使用的淀粉有太白粉、玉米淀粉、菱粉、藕粉、马铃薯淀粉、绿豆
  • 2019年中央广播电视总台六一晚会2019年中国中央电视台六一晚会(简称2019年六一晚会)是中央广播电视总台于2019年六一儿童节举办的少儿文艺晚会,该晚会的主题为“快乐向未来”,由许蓓蓓执导。首播:重播:央视网、爱
  • 奥斯曼·福阿德奥斯曼·福阿德(土耳其语:Osman Fuad;1895年2月24日-1973年5月19日),是1954年-1973年间奥斯曼帝国王朝第39代领袖,也是奥斯曼帝国灭亡后王朝的第三代领袖。他在奥塔科伊的彻拉安宫,是