统计学习理论

✍ dations ◷ 2025-01-23 06:21:32 #统计学习理论
统计学习理论(英语:Statistical learning theory),一种机器学习的架构,根据统计学与泛函分析(Functional Analysis)而建立。统计学习理论基于资料(data),找出预测性函数,之后解决问题。支持向量机(Support Vector Machine)的理论基础来自于统计学习理论。令 X {displaystyle X} 为所有可能的输入组成的向量空间, Y {displaystyle Y} 为所有可能的输出组成的向量空间。统计学习理论认为,积空间 Z = X × Y {displaystyle Z=Xtimes Y} 上存在某个未知的概率分布 p ( z ) = p ( x → , y ) {displaystyle p(z)=p({vec {x}},y)} 。训练集由这个概率分布中的 n {displaystyle n} 个样例构成,并用 S = { ( x → 1 , y 1 ) , … , ( x → n , y n ) } = { z → 1 , … , z → n } {displaystyle S={({vec {x}}_{1},y_{1}),dots ,({vec {x}}_{n},y_{n})}={{vec {z}}_{1},dots ,{vec {z}}_{n}}} 表示。每个 x → i {displaystyle {vec {x}}_{i}} 都是训练数据的一个输入向量, 而 y i {displaystyle y_{i}} 则是对应的输出向量。损失函数的选择是机器学习算法所选的函数 f S {displaystyle f_{S}} 中的决定性因素。 损失函数也影响着算法的收敛速率。损失函数的凸性也十分重要。根据问题是回归问题还是分类问题,我们可以使用不同的损失函数。回归问题中最常用的损失函数是平方损失函数(也被称为L2-范数)。类似的损失函数也被用在普通最小二乘回归。其形式是:另一个常见的损失函数是绝对值范数(L1-范数):某种程度上说0-1指示函数是分类问题中最自然的损失函数。它在预测结果与真实结果相同时取0,相异时取1。对于 Y = { − 1 , 1 } {displaystyle Y={-1,1}} 的二分类问题,这可以表示为:其中 θ {displaystyle theta } 为单位阶跃函数。机器学习的一大常见问题是过拟合。由于机器学习是一个预测问题,其目标并不是找到一个与(之前观测到的)数据最拟合的的函数,而是寻找一个能对未来的输入作出最精确预测的函数。经验风险最小化有过拟合的风险:找到的函数完美地匹配现有数据但并不能很好地预测未来的输出。过拟合的常见表现是不稳定的解:训练数据的一个小的扰动会导致学到的函数的巨大波动。可以证明,如果解的稳定性可以得到保证,那么其可推广性和一致性也同样能得到保证。 正则化可以解决过拟合的问题并增加解的稳定性。正则化可以通过限制假设空间 H {displaystyle {mathcal {H}}} 来完成。一个常见的例子是把 H {displaystyle {mathcal {H}}} 限制为线性函数:这可以被看成是把问题简化为标准设计的线性回归。 H {displaystyle {mathcal {H}}} 也可以被限制为 p {displaystyle p} 次多项式,指数函数,或L1上的有界函数。对假设空间的限制能防止过拟合的原因是,潜在的函数的形式得到了限制,因此防止了那些能给出任意接近于0的经验风险的复杂函数。一个正则化的样例是吉洪诺夫正则化,即最小化如下损失函数其中正则化参数 γ {displaystyle gamma } 为一个固定的正参数。吉洪诺夫正则化保证了解的存在性、唯一性和稳定性。

相关

  • 储能技术储能技术主要是指电能的储存。储存的能量可以用做应急能源,也可以用于在电网负荷低的时候储能,在电网高负荷的时候输出能量,用于削峰填谷,减轻电网波动。能量有多种形式,包括辐射
  • 多足亚门多足亚门(或称多足类、多足纲,学名Myriapoda,来自古希腊语μυριάς一万和 πούς脚、腿),是节肢动物门下的一类,包含了马陆及蜈蚣等。多足类有超过13000个物种,都是陆地动物
  • 广翅鲎板足鲎目(学名:Eurypterida)又名广翅鲎目、广翼目,通称板足鲎、广翅鲎、海蝎,是一类已灭绝的节肢动物,大约有300种已知的板足鲎。诞生于奥陶纪,距今约4亿6700万年前,繁盛于志留纪,灭
  • 滑雪滑雪板是一种通过使用者穿戴于脚上,以此帮助滑雪者在雪上滑行的工具。初期使用于游览区救援,现在主要用于体育和娱乐方面。滑雪板发明于20世纪初的北欧,用来提高滑雪者在滑雪时
  • 法式城堡法式城堡(法语:château 法语发音:.mw-parser-output .IPA{font-family:"Charis SIL","Doulos SIL","Linux Libertine","Segoe UI","Lucida Sans Unicode","Code2000","Gentium
  • 增强子增强子(英语:enhancer)又可译为强化子,是DNA上一小段可与蛋白质(反式作用因子;trans-acting factor)结合的区域,与蛋白质结合之后,基因的转录作用将会加强。增强子可能位于基因上游,也
  • 亚历山大二世亚历山大·麦克威廉(中世纪盖尔语:Alaxandair mac Uilliam;现代盖尔语:Alasdair mac Uilleim;现代化简称为亚历山大二世;1198年8月24日– 1249年7月6日)是苏格兰国王(1214年-1249年
  • 穴位腧穴又称穴位,是中国传统医学在人体分布体表的脏腑经络循环路线中,对气血汇聚、转输与出入之所的特定处所给定的名称,既是疾病的反应点,又是针灸推拿等医学临床的刺激点。腧穴在
  • 文莱立法会文莱立法会(马来语:Majlis Mesyuarat Negara Brunei)是文莱的国家咨询机构,实行一院制。文莱立法会议员不是由选举产生,而是由文莱苏丹直接委任。本届立法会由议长和30名委任议员
  • 1988年1988年欧洲足球锦标赛(Euro 88)于1988年6月10日至25日在西德举行。本届比赛是由欧洲足联主办的第八届欧洲足球锦标赛。本届决赛圈赛制及参赛队数均与去届相同,8支球队首先分为