首页 >
自助法
✍ dations ◷ 2025-12-11 16:46:46 #自助法
在统计学中,自助法(Bootstrap Method,Bootstrapping,或自助抽样法)是一种从给定训练集中有放回的均匀抽样,也就是说,每当选中一个样本,它等可能地被再次选中并被再次添加到训练集中。自助法由Bradley Efron于1979年在《Annals of Statistics》上发表。当样本来自能以正态分布来描述的总体,其抽样分布(英语:Sampling Distribution)为正态分布;但当样本来自的总体无法以正态分布来描述,则以渐进分析法、自助法等来分析。采用随机可置换抽样(random sampling with replacement)。对于小数据集,自助法效果很好。最常用的一种是.632自助法,假设给定的数据集包含d个样本。该数据集有放回地抽样d次,产生d个样本的训练集。这样原数据样本中的某些样本很可能在该样本集中出现多次。没有进入该训练集的样本最终形成检验集(测试集)。
显然每个样本被选中的概率是1/d,因此未被选中的概率就是(1-1/d),这样一个样本在训练集中没出现的概率就是d次都未被选中的概率,即(1-1/d)d。当d趋于无穷大时,这一概率就将趋近于e-1=0.368,所以留在训练集中的样本大概就占原来数据集的63.2%。
相关
- 羟基.mw-parser-output ruby>rt,.mw-parser-output ruby>rtc{font-feature-settings:"ruby"1}.mw-parser-output ruby.large{font-size:250%}.mw-parser-output ruby.larger{fon
- 离子离子 (英语:Ion)是指原子或原子基团失去或得到一个或几个电子而形成的带电荷的个子。得失电子的过程称为电离,电离过程的能量变化可以用电离能来衡量。在化学反应中,通常是金属元
- 巴塞尔公约巴塞尔公约(英语:Basel Convention)于1989年草拟、1992年正式生效。它是一控制有害废弃物越境转移的国际公约。公约的主要目的为:1970年代,西方各国开始关注电子废料和其余有毒废
- 赫芬顿邮报《赫芬顿邮报》(英语:Huffpost,原名英语:The Huffington Post)是一个美国的多语言网络传媒。该传媒由阿里安娜·赫芬顿、肯尼斯·勒利尔(英语:Kenneth Lerer)、安德鲁·布莱巴特及乔
- 胎儿发育产前(Prenatal)或产前发育(Prenatal development)是人类胚胎或胎儿在孕期的孕育过程,从受精,至诞生。通常,也可使用术语胚胎发育、胎儿发育,或胚胎学来表示。胚胎发育始于受精。
- 水产学渔业、水产业是指采捕或养殖水生动物、植物的生产事业和行业。渔业狭义上指捕捞渔业或称捕鱼业、渔捞业,可细分近海渔业和远洋渔业。此外,渔业还有一种叫养殖渔业(或称水产养殖
- 石松纲石松纲是石松门中的一纲。传统上,石松纲不只包含石松及石杉,亦包含卷柏及水韭,但后两者现在通常被分成另一纲-水韭纲中。石松被认为在结构上和最早的维管束植物相似,有小且鳞状的
- 皮埃尔·尚邦皮埃尔·尚邦(法语:Pierre Chambon,1931年2月7日-),出生于法国米卢斯,法国斯特拉斯堡的遗传、细胞和分子生物学研究所的创始人。他利用基因的克隆和测序技术的第一次破译真核生物基
- 复合结果复合结果(英文:Joint effect),是一种因果谬误,系指当某些原因导致多个结果时,在多个结果之间建立因果关联。国家发生战乱,小明一家人因为房子被炮火所毁而从北部逃到南部。有可能是
- 李安民李安民(1946年9月-),生于重庆,籍贯四川大竹县,中国数学家,四川大学教授。1969年毕业于北京大学数学力学系,1981年获该校硕士学位,1991年获德国柏林技术大学博士学位。
