首页 >
自助法
✍ dations ◷ 2025-05-16 07:26:45 #自助法
在统计学中,自助法(Bootstrap Method,Bootstrapping,或自助抽样法)是一种从给定训练集中有放回的均匀抽样,也就是说,每当选中一个样本,它等可能地被再次选中并被再次添加到训练集中。自助法由Bradley Efron于1979年在《Annals of Statistics》上发表。当样本来自能以正态分布来描述的总体,其抽样分布(英语:Sampling Distribution)为正态分布;但当样本来自的总体无法以正态分布来描述,则以渐进分析法、自助法等来分析。采用随机可置换抽样(random sampling with replacement)。对于小数据集,自助法效果很好。最常用的一种是.632自助法,假设给定的数据集包含d个样本。该数据集有放回地抽样d次,产生d个样本的训练集。这样原数据样本中的某些样本很可能在该样本集中出现多次。没有进入该训练集的样本最终形成检验集(测试集)。
显然每个样本被选中的概率是1/d,因此未被选中的概率就是(1-1/d),这样一个样本在训练集中没出现的概率就是d次都未被选中的概率,即(1-1/d)d。当d趋于无穷大时,这一概率就将趋近于e-1=0.368,所以留在训练集中的样本大概就占原来数据集的63.2%。
相关
- 醋酸铅2.55 g/cm3(三水合物)75 °C(三水合物分解)乙酸铅,又称醋酸铅,是一种白色晶体状化合物,带甜味。将铅黄(一氧化铅)和乙酸反应可以制备乙酸铅。和其他铅化合物一样,乙酸铅也有很大毒性
- 脚趾脚趾是人或一些动物的脚上的指头。人的脚趾的背部受指甲的保护,其他动物则演变成爪。人类脚趾在生理学上扮演的意义不亚于双手,在演化学的研究中相当重要。现代人的双脚绝大多
- 大地测量学大地测量学是在一定的时间与空间参考系中,测量和描绘地球形状及其重力场并监测其变化,为人类活动提供地球空间信息的一门学科,属于地球科学的一个分支,也是一切测绘科学技术的基
- 悉尼·奥尔特曼西德尼·奥尔特曼(英语:Sidney Altman,或译奥特曼,1939年3月7日-),加拿大分子生物学家,现任耶鲁大学分子、细胞和发育生物学及化学斯特林教授。1989年,他和托马斯·切赫因为对RNA的催
- 分类阶元分类单元(分类群,德语:Taxon)是指分类学上的一个群体,不管处哪一个分类阶层(taxonomic rank),称此群体为分类群。各个分类阶层皆可能具多个分类群,而其整体亦为一个分类群。分类群可
- 婆婆纳婆婆纳(学名:Veronica didyma)是一种车前草科植物,也称“双肾草”。一年至二年生草本,有短柔毛。有蓝、白、粉三种颜色。茎自基部分枝,下部匍匐地面。三角状圆形或近圆形的叶子在
- 死亡之手死亡之手是冷战时期苏联的一套核武器操控设备。它包括一套计算机系统,通过检测地震波、放射线等数据判定苏联是否已经遭到核攻击,如判定遭到攻击,系统会发射特别的“广播导弹”
- 比耶省比耶省(葡萄牙语:Província de Bié)位于安哥拉,与库安多古班哥省、南广萨省、万博省、威拉省、南伦达省、马兰哲省、莫希科省等省份相邻。
- 420110 数学 120 信息科学与系统科学 130 力学 140 物理学 150 化学 160 天文学 170 地球科学 180 生物学210 农学 220 林学 230 畜牧、兽医科学 240 水产学310
- 亲电性亲电体(英语:Electrophile,意思为电子喜好者)为一化学术语,指在化学反应中对含有可成键电子对的原子或分子(亲核试剂)有亲和作用的原子或分子。因为亲电试剂可以接受电子,所以它们是