VC维

✍ dations ◷ 2025-10-03 15:52:12 #维度,统计分类

在VC理论中,VC维(Vapnik-Chervonenkis Dimension,由Vladimir Vapnik与Alexey Chervonenkis提出)是对一个可学习分类函数空间的能力(复杂度,表示能力等)的衡量。它定义为算法能“打散”的点集的势的最大值。直观地,一个分类模型的能力与其复杂程度相关。例如,考虑一个高次多项式的分类模型:若函数值大于0则分类为正,反之则分类为负。高次多项式能够“摆动”的范围很大,所以能够很好地拟合给定的点集。当然因此,这样的模型也很可能会在其他符合原点集趋势的点集上分类错误。我们说这一多项式是高能力的。如果考虑一个简单的线性分类模型,就不一定能够很好地拟合给定的点集。

给定一集合族 H {\displaystyle H} 为如下的集合族:

H C := { h C | h H } {\displaystyle H\cap C:=\{h\cap C\vert h\in H\}}

H {\displaystyle H} 能打散 C {\displaystyle C} ,当且仅当 H C {\displaystyle H\cap C} 包含 C {\displaystyle C} 的所有子集,即

| H C | = 2 | C | {\displaystyle \vert H\cap C\vert =2^{\vert C\vert }}

H {\displaystyle H} 的VC维定义为能被 H {\displaystyle H} 打散的势最大的集合的势。

对一个参数记为 θ {\displaystyle \theta } 的分类模型 f {\displaystyle f} ,称模型 f {\displaystyle f} 能够打散一点集 X = { x 1 , x 2 , , x n } {\displaystyle X=\{x_{1},x_{2},\cdots ,x_{n}\}} ,当且仅当对任意标签集 Y { 1 , + 1 } n {\displaystyle Y\in \{-1,+1\}^{n}} 都存在参数 θ {\displaystyle \theta ^{*}} 使得 f θ {\displaystyle f_{\theta ^{*}}} ( X , Y ) {\displaystyle (X,Y)} 上分类完全正确。

模型 f {\displaystyle f} 的VC维定义为能被 f {\displaystyle f} 打散的势最大的点集的势,或等价地,满足存在 X {\displaystyle X} | X | = D {\displaystyle \vert X\vert =D} 使得 f {\displaystyle f} 能打散 X {\displaystyle X} 的最大的 D {\displaystyle D}

相关

  • 以人口排列的语言列表本条目为主要语言人口列表,罗列现时世上主要语言的语言人口,并依其人口排序。所谓语言人口,系指以该语言为母语的人口。由于不同统计之间的数据有所分别(有以母语为基础,或以第一
  • 树干树干,亦写作树干,是树木的主要茎干,木质,由地面开始,向上到分为树枝为止。树干负责承拓整株植物,树干里的木质部负责运输供水及营养以助光合作用和新陈代谢。树干是木本植物的茎特
  • 科达树见内文科达树(学名:Cordaites)是一属已灭绝的树状植物,与种子蕨类同样由前裸子植物演化而来,为现今银杏类与松柏类植物的祖先。生长在与佛罗里达州大沼泽地相似的湿地中,常在其树
  • 奇异物质奇异物质(英语:strange matter)是夸克物质(英语:QCD matter)的一种特例,通常认为是包含上夸克、下夸克和奇夸克的流体。这是与核物质(英语:nuclear matter)(质子、中子等构成的普通物质
  • 杂种杂种可以指:
  • 乔治·勒梅特乔治·亨利·约瑟夫·爱德华·勒梅特(法语:Georges Henri Joseph Édouard Lemaître,1894年7月17日-1966年6月20日),生于比利时沙勒罗瓦,宇宙学家。1894年出生于比利时的沙勒罗瓦,
  • 越轨劈腿族(promiscuity)是指同时拥有两位或更多情人者。华人古时有“脚踏两条船”(台语俗谚:“双脚踏双船,心肝乱纷纷”)的说法,形容一个人用情不专,在两个对象之中周游不定。“劈腿”
  • 阿富汗人阿富汗人可以是:
  • 大龙国小台北市立大龙国民小学(简称大龙国小),前身为1896年创立的为台湾国语学校第三附属学校,是台北市历史最久的国民小学之一。
  • 北美洲撞击坑列表北美洲撞击坑列表列出所有在北美洲的撞击坑,这些撞击坑形成原因为大型陨石与彗星自宇宙坠落在地球撞击造成的。在经过侵蚀与深埋等作用,这些撞击坑直径只能从撞击坑的轮缘(英语