首页 >
交叉验证
✍ dations ◷ 2025-10-26 15:45:57 #交叉验证
交叉验证,有时亦称循环估计 ,
是一种统计学上将数据样本切割成较小子集的实用方法。于是可以先在一个子集上做分析,而其它子集则用来做后续对此分析的确认及验证。一开始的子集被称为训练集。而其它的子集则被称为验证集或测试集。交叉验证的目的,是用未用来给模型作训练的新数据,测试模型的性能,以便减少诸如过拟合和选择偏差等问题,并给出模型如何在一个独立的数据集上通用化(即,一个未知的数据集,如实际问题中的数据)。交叉验证的理论是由Seymour Geisser(英语:Seymour Geisser)所开始的。它对于防范根据数据建议的测试假设是非常重要的,特别是当后续的样本是危险、成本过高或科学上不适合时去搜集。假设有个未知模型具有一个或多个待定的参数,且有一个数据集能够反映该模型的特征属性(训练集)。适应的过程是对模型的参数进行调整,以使模型尽可能反映训练集的特征。如果从同一个训练样本中选择独立的样本作为验证集合,当模型因训练集过小或参数不合适而产生过拟合时,验证集的测试予以反映。
交叉验证是一种预测模型拟合性能的方法。常识来说,Holdout 验证并非一种交叉验证,因为数据并没有交叉使用。
随机从最初的样本中选出部分,形成交叉验证数据,而剩余的就当做训练数据。
一般来说,少于原本样本三分之一的数据被选做验证数据。k折交叉验证(英语:k-fold cross-validation),将训练集分割成k个子样本,一个单独的子样本被保留作为验证模型的数据,其他k − 1个样本用来训练。交叉验证重复k次,每个子样本验证一次,平均k次的结果或者使用其它结合方式,最终得到一个单一估测。这个方法的优势在于,同时重复运用随机产生的子样本进行训练和验证,每次的结果验证一次,10次交叉验证是最常用的。正如名称所建议,留一验证(英语:leave-one-out cross-validation, LOOCV)意指只使用原本样本中的一项来当做验证资料,而剩余的则留下来当做训练资料。这个步骤一直持续到每个样本都被当做一次验证资料。
事实上,这等同于k折交叉验证,其中k为原本样本个数。
在某些情况下是存在有效率的算法,如使用kernel regression(英语:kernel regression) 和吉洪诺夫正则化。可以计算估计误差。常见的误差衡量标准是均方差和方根均方差,
分别为交叉验证的方差和标准差。
相关
- 受控词表受控词表,又称为控制词汇表、受控词汇表或者控制词表, 是一种对知识加以组织整理,以便后续进行检索的手段。受控词表在主题词标引方案、主题词表、叙词表、分类法以及本体等语
- 银屑病干癣(英语:psoriasis,/soʊˈraɪ.əsᵻs/,学名为银屑病,又称“白疕”或“牛皮癣”)是一种慢性皮肤疾病,主要特色是在身上出现一块一块异常的皮肤。通常,这些块状皮肤异常会发红、发
- 南安普敦大学南安普敦大学(英语:University of Southampton)亦称修咸顿大学,位于英国南部港口城市南安普敦的著名研究型大学。其可追溯自1862年由亨利·罗宾逊·哈特利爵士之遗产所创办之哈
- 身心医学人体解剖学 - 人体生理学 组织学 - 胚胎学 人体寄生虫学 - 免疫学 病理学 - 病理生理学 细胞学 - 营养学 流行病学 - 药理学 - 毒理学身心医学(英语:Psychosomatic medicine),
- 蛋白同化甾类蛋白同化甾类(英语:Anabolic steroid)是一种能够促进细胞的生长与分化,使肌肉扩增,甚至是骨头的强度与大小的甾体激素。同化激素是由天然来源的雄性激素经结构改造,降低雄激素活性
- 腋下腋窝(Axilla)是一个解剖构造,又称腋下、胳肢窝。腋窝位于肩关节下方,是描述躯干与手臂连接并接触的部位,腋窝内具有许多血管及神经经过,并具有许多汗腺。在人体中,腋臭最常发生于腋
- iUniversity of Chicago Press芝加哥大学出版社(University of Chicago Press)是位于芝加哥大学中途公园的一个出版社,由芝加哥大学运营,成立于1890年,现为美国最大最古老的大学出版社之一。除去各种书籍和期
- 阴间地狱,被一些人认为是人死亡后灵魂会到的地方。在汉族传统宗教观念中,地狱是阴间地府的一部分。地狱的观念广泛分布于世界各地的宗教信仰观念中,如道教、佛教、印度教、现今的犹
- 氟班色林氟班色林(英语:Flibanserin)(代号:BIMT-17),商品名为Addyi,研究发现是一种用来治疗绝经前妇女的性欲障碍(HSDD)的药物。氟班色林由勃林格殷格翰公司开发,但是在2010年10月得到了美国食
- 阿里斯塔克斯阿里斯塔克斯(希腊语:Ἀρίσταρχος,Aristarkhos;公元前310年-前230年),古希腊天文学家,数学家。他生于古希腊萨摩斯岛。他是史上有记载的首位创立日心说的天文学者,他将太阳
