自助法

✍ dations ◷ 2025-11-26 01:51:03 #自助法
在统计学中,自助法(Bootstrap Method,Bootstrapping,或自助抽样法)是一种从给定训练集中有放回的均匀抽样,也就是说,每当选中一个样本,它等可能地被再次选中并被再次添加到训练集中。自助法由Bradley Efron于1979年在《Annals of Statistics》上发表。当样本来自能以正态分布来描述的总体,其抽样分布(英语:Sampling Distribution)为正态分布;但当样本来自的总体无法以正态分布来描述,则以渐进分析法、自助法等来分析。采用随机可置换抽样(random sampling with replacement)。对于小数据集,自助法效果很好。最常用的一种是.632自助法,假设给定的数据集包含d个样本。该数据集有放回地抽样d次,产生d个样本的训练集。这样原数据样本中的某些样本很可能在该样本集中出现多次。没有进入该训练集的样本最终形成检验集(测试集)。 显然每个样本被选中的概率是1/d,因此未被选中的概率就是(1-1/d),这样一个样本在训练集中没出现的概率就是d次都未被选中的概率,即(1-1/d)d。当d趋于无穷大时,这一概率就将趋近于e-1=0.368,所以留在训练集中的样本大概就占原来数据集的63.2%。

相关

  • 超抗原超级抗原(SAgs)是一类导致非特异性免疫的蛋白质。超级抗原非特异性地激活T细胞,导致T细胞克隆激活和大量细胞激素的释放。超级抗原被微生物抗原(包括支原体,细菌,病毒等等)作为可以
  • 核黄素缺乏症核黄素,又称维生素B2,维他命B2,维生素G。分子式C17H20N4O6。它是人体必需的13种维生素之一,作为维生素B族的成员之一,微溶于水,可溶于氯化钠溶液,易溶于稀的氢氧化钠溶液。1879年英
  • 磺胺林磺胺林是一种磺胺类药物,其INN名称是“Sulfalene”。该药物可用于治疗慢性支气管炎、泌尿道感染和疟疾等病症。该药物在血液中的半衰期尚不明确,在大鼠体内的LD50(半致死量)为1.
  • 水星水星(拉丁语:Mercurius;英语:Mercury),中国古称辰星;到西汉时期,《史记‧天官书》作者天文学家司马迁从实际观测发现辰星呈灰色,与“五行”学说联系在一起,以黑色配水星,因此正式把它命
  • 戊巴比妥戊巴比妥是一种在1928年被合成出来短效巴比妥类药物。以游离酸或钠盐的形式成药。游离酸形式的戊巴比妥微溶于水和乙醇。 此药的商品名为耐波他(Nembutal)。早期当作安眠药使
  • 生态农业生态农业,是将符合生态运作的方式运用在农业生产系统里面的一种研究。生态农业英文是“Agroecology”, agro- 这个字首代表的就是农业。使用生态学的原则来处理农业生态系统(ag
  • 卡利亚里卡利亚里(意大利语:Cagliari),是撒丁岛的首府,是意大利内的一个自治区。卡利亚里在萨丁尼亚语是称为Casteddu(照字面地是指“城堡”),位处撒丁岛南部,属海港都市。它大约有170,000人
  • MnOsub2/sub二氧化锰(化学式:MnO2, MnO 2
  • 东德转型东德转型(德语:Die Wende)在德语中指代1989年至1990年德意志民主共和国(东德)政治、经济与社会的转型,其内容为德国统一社会党政权及中央计划经济的终结,恢复议会民主制和市场经济,
  • 因尼斯学院坐标:43°39′56″N 79°23′56″W / 43.66556°N 79.39889°W / 43.66556; -79.39889因尼斯学院是组成多伦多大学的成员学院之一,它在规模和学院人数上都是大学中最小的学院