首页 >
交叉验证
✍ dations ◷ 2024-11-06 00:20:42 #交叉验证
交叉验证,有时亦称循环估计 ,
是一种统计学上将数据样本切割成较小子集的实用方法。于是可以先在一个子集上做分析,而其它子集则用来做后续对此分析的确认及验证。一开始的子集被称为训练集。而其它的子集则被称为验证集或测试集。交叉验证的目的,是用未用来给模型作训练的新数据,测试模型的性能,以便减少诸如过拟合和选择偏差等问题,并给出模型如何在一个独立的数据集上通用化(即,一个未知的数据集,如实际问题中的数据)。交叉验证的理论是由Seymour Geisser(英语:Seymour Geisser)所开始的。它对于防范根据数据建议的测试假设是非常重要的,特别是当后续的样本是危险、成本过高或科学上不适合时去搜集。假设有个未知模型具有一个或多个待定的参数,且有一个数据集能够反映该模型的特征属性(训练集)。适应的过程是对模型的参数进行调整,以使模型尽可能反映训练集的特征。如果从同一个训练样本中选择独立的样本作为验证集合,当模型因训练集过小或参数不合适而产生过拟合时,验证集的测试予以反映。
交叉验证是一种预测模型拟合性能的方法。常识来说,Holdout 验证并非一种交叉验证,因为数据并没有交叉使用。
随机从最初的样本中选出部分,形成交叉验证数据,而剩余的就当做训练数据。
一般来说,少于原本样本三分之一的数据被选做验证数据。k折交叉验证(英语:k-fold cross-validation),将训练集分割成k个子样本,一个单独的子样本被保留作为验证模型的数据,其他k − 1个样本用来训练。交叉验证重复k次,每个子样本验证一次,平均k次的结果或者使用其它结合方式,最终得到一个单一估测。这个方法的优势在于,同时重复运用随机产生的子样本进行训练和验证,每次的结果验证一次,10次交叉验证是最常用的。正如名称所建议,留一验证(英语:leave-one-out cross-validation, LOOCV)意指只使用原本样本中的一项来当做验证资料,而剩余的则留下来当做训练资料。这个步骤一直持续到每个样本都被当做一次验证资料。
事实上,这等同于k折交叉验证,其中k为原本样本个数。
在某些情况下是存在有效率的算法,如使用kernel regression(英语:kernel regression) 和吉洪诺夫正则化。可以计算估计误差。常见的误差衡量标准是均方差和方根均方差,
分别为交叉验证的方差和标准差。
相关
- 口腔口腔,简称口,俗称嘴巴、嘴或咀,是指唇、腭、面颊和口腔底之间的空间,向上它与鼻腔相通。向后口腔与两个颌弓后的咽腔相连。口腔的后面的开口是咽峡,前面的开口是嘴。整个口腔的内
- 孔雀孔雀(学名:Pavo),是一种鸟类,属鸡形目,雉科,又名越鸟、南客。孔雀有三种,绿孔雀和蓝孔雀属于该属,而刚果孔雀单独成属。蓝孔雀又名印度孔雀,雄鸟羽毛为宝蓝色,富有金属光泽,分布在印度和
- primer引物(英文:primer),又译引子,是一小段单链DNA或RNA,作为DNA复制的起始点,存在于自然中生物的DNA复制(RNA引物)和聚合酶链式反应(PCR)中人工合成的引物(通常为DNA引物)。之所以需要引物是
- 行政机关行政机关,又称行政机构、行政部门,其工作是对组织进行日常的管理并施行法律政策等相关活动,是三权分立中的其中一部分。广义上,行政定义为负责国家政策的执行的政府机构。狭义上
- CD45n/an/an/an/an/an/an/an/an/an/a蛋白酪氨酸磷酸酶C型受体(英语:Protein tyrosine phosphatase, receptor type, C,缩写:PTPRC)是一个由PTPRC人类基因编码的酶 蛋白酪氨酸磷酸酶C
- 剑突胸骨(Sternum)是胸腔中前方一块扁平,剑状的骨,接有肋 。因为其外形如此,故其拉丁文中被名为剑,其三部分为胸骨柄上部的颈静脉切迹(Incisura jugularis)可在体表触及,此乃颈部的下界。
- 入赘入赘又称为招赘、入赘婚,为婚姻模式一种。简单来说,男子如同古代女子出嫁般,成为女方家庭成员,视岳父母为父母。入赘的男子称赘夫、赘婿,俗称为姑爷。在中国,入赘俗称“倒插门”、
- 代谢当量代谢当量商(Metabolic Equivalent of Task, MET)是一种进行生物活动时的一种生物学特性,可以用于计算从事某一类活动时的代谢水平。本条目中未有特别说明的,一律指人类活动。MET
- 释放甲状腺激素(英语:thyroid hormones)是由甲状腺滤泡上皮细胞合成的酪氨酸碘化物。主要是四碘甲腺原氨酸(又名甲状腺素,缩写为T4)和三碘甲腺原氨酸(缩写为T3),此外,还有少量逆-三碘甲腺
- 咖啡这是一个各国(地区)年人均咖啡消费量列表,最新的为2009年的数据。