首页 >
自助法
✍ dations ◷ 2025-11-30 12:50:45 #自助法
在统计学中,自助法(Bootstrap Method,Bootstrapping,或自助抽样法)是一种从给定训练集中有放回的均匀抽样,也就是说,每当选中一个样本,它等可能地被再次选中并被再次添加到训练集中。自助法由Bradley Efron于1979年在《Annals of Statistics》上发表。当样本来自能以正态分布来描述的总体,其抽样分布(英语:Sampling Distribution)为正态分布;但当样本来自的总体无法以正态分布来描述,则以渐进分析法、自助法等来分析。采用随机可置换抽样(random sampling with replacement)。对于小数据集,自助法效果很好。最常用的一种是.632自助法,假设给定的数据集包含d个样本。该数据集有放回地抽样d次,产生d个样本的训练集。这样原数据样本中的某些样本很可能在该样本集中出现多次。没有进入该训练集的样本最终形成检验集(测试集)。
显然每个样本被选中的概率是1/d,因此未被选中的概率就是(1-1/d),这样一个样本在训练集中没出现的概率就是d次都未被选中的概率,即(1-1/d)d。当d趋于无穷大时,这一概率就将趋近于e-1=0.368,所以留在训练集中的样本大概就占原来数据集的63.2%。
相关
- 半合成"半合成"指以从来自于动物、植物或微生物的天然产物为起始原料合成最终产物的化学合成方法。所需原料通常已具备最终产物的基本骨架及其多数官能团,甚至已具备最终产物所需的
- 肛交肛门性交(英语:Anal intercourse),简称肛交,一般是指将勃起的阴茎与人类的肛门或直肠互相接合并彼此摩擦的过程,主要目的是为了令自身获得性快感。 其他形式的肛交包括以假阴茎、
- 萨贡托萨贡托(Sagunto)是一座西班牙东部城市,位于瓦伦西亚省,距其省会城市瓦伦西亚约30公里。城市处于丘陵地带,也是一座海岸城市。2008年人口总计65,821。约在公元前五世纪时,西班牙的
- 神经肌肉接点神经肌肉接点又称神经肌肉接触面。神经纤维与肌肉细胞之间的化学联络点。与神经元之间的突触同功。神经纤维分为许多末梢分支,每个分支嵌入肌细胞膜上称为终板的凹陷中。终板
- 苯炔芳炔是从芳环去除两个邻位取代基后(剩下含两个电子的两个轨道)得到的电中性活性中间体。 与碳烯和氮烯类似,芳炔也有单线态和三线态各一个。苯炔(C6H4,右图标号1)是最简单的芳炔。
- 远紫外分光探测器远紫外分光探测器(英语:Far Ultraviolet Spectroscopic Explorer,缩写为FUSE)是约翰霍普金斯大学应用物理实验室为美国宇航局研制的一颗紫外天文卫星,是美国宇航局“起源计划”的
- 黑索今黑索金(英文cyclonite),一种高能炸药,学名环三亚甲基三硝胺(cyclotrimethylenetrinitramine),其通称RDX为Research Department explosive的缩写。 黑索金又名为旋风炸药,化学式(CH2
- 杜南让·亨利·杜南(法语:Jean Henri Dunant,1828年5月8日-1910年10月30日)是瑞士商人和人道主义者,红十字会创办人,后人尊称他为“红十字会之父”。1859年,他于出差途中目睹了索尔费里
- 第谷·布拉赫第谷·布拉赫(Tycho Brahe,1546年12月14日-1601年10月24日),丹麦贵族,天文学家兼占星术士和炼金术士。他最著名的助手是开普勒。第谷出生时叫Tyge,他约于15岁时将自己的名字拉丁化
- 山极胜三郎山极胜三郎(日语:山極 勝三郎/やまぎわ かつさぶろう Yamagiwa Katsusaburō ?,1863年4月10日-1930年3月2日),是日本病理学家、诗人,东京帝国大学教授。信浓国上田藩(今·长野县上
