首页 >
自助法
✍ dations ◷ 2025-11-21 09:54:49 #自助法
在统计学中,自助法(Bootstrap Method,Bootstrapping,或自助抽样法)是一种从给定训练集中有放回的均匀抽样,也就是说,每当选中一个样本,它等可能地被再次选中并被再次添加到训练集中。自助法由Bradley Efron于1979年在《Annals of Statistics》上发表。当样本来自能以正态分布来描述的总体,其抽样分布(英语:Sampling Distribution)为正态分布;但当样本来自的总体无法以正态分布来描述,则以渐进分析法、自助法等来分析。采用随机可置换抽样(random sampling with replacement)。对于小数据集,自助法效果很好。最常用的一种是.632自助法,假设给定的数据集包含d个样本。该数据集有放回地抽样d次,产生d个样本的训练集。这样原数据样本中的某些样本很可能在该样本集中出现多次。没有进入该训练集的样本最终形成检验集(测试集)。
显然每个样本被选中的概率是1/d,因此未被选中的概率就是(1-1/d),这样一个样本在训练集中没出现的概率就是d次都未被选中的概率,即(1-1/d)d。当d趋于无穷大时,这一概率就将趋近于e-1=0.368,所以留在训练集中的样本大概就占原来数据集的63.2%。
相关
- 需求层次理论马斯洛的需求层次理论(英语:Maslow's hierarchy of needs)是亚伯拉罕·马斯洛于1943年《心理学评论》的论文〈人类动机的理论〉(A Theory of Human Motivation)中所提出的理论。
- 图形图形在数学上可以依靠不同的附加结构而形成不同的门类,按附加结构的复杂程度,可以依次分述如下:
- 大阪市立大学大阪市立大学(日语:大阪市立大学/おおさかしりつだいがく Osaka City University),是位于日本大阪府大阪市的公立大学,简称市大(しだい・いちだい),是旧三商大之一,也是日本第一所“
- 通俗拉丁语通俗拉丁语(拉丁文:sermo vulgaris,意为“通俗话”,又叫民间拉丁语,或流行拉丁语),是古典拉丁语在法国、意大利、西班牙、葡萄牙、罗马尼亚等地的民间通俗变体。中世纪早期开始分化
- 异戊巴比妥异戊巴比妥(Amobarbital或Amylobarbitone)是一种巴比妥类药物的衍生物,主要的功能是用于作为中效镇静剂,以治疗如失眠之类的症状。 除了作为药物之外,异戊巴比妥也因为其中枢神经
- 列氏列氏温标,代表符号为为°Ré、°R或°R,由法国科学家列奥米尔于1731年提出。水的冰点被定为列氏0度,而沸点则为列氏80度。因此,如欲将列氏温标表示的温度转为摄氏温标,须把列氏乘
- 齐民要术《齐民要术》是中国保存得最完整的一本古代农牧情况的钜著,由北魏官员贾思勰所著,成书于东魏武定二年(544年),另一说为533年至544之间。收录公元6世纪时中国黄河流域下游地区的农
- 集结集结(梵文:saṃgīti),又称结集,亦称为合诵或会诵。早期佛教并没有书面经典,僧众以口头传诵方式传承佛陀教法。结集是指僧团进行集会,由上座比丘主持,与会三藏比丘分别诵出佛的教法,
- 再城市化再城市化(英语:Reurbanization),也称为再城镇化,是城市化发展进程的一个阶段,是针对逆城市化而言的一个应对过程,使得城市因发生逆城市化而衰败的城市中心区再度城市化的过程,是城市
- 托勒密八世托勒密八世·费斯康(施惠者二世)Πτολεμαίος Η' Ευεργέτης Β' ή Φύσκων(约前182年—前116年6月26日)埃及托勒密王朝国王(前170年—前163年,前145年—
