首页 >
自助法
✍ dations ◷ 2025-11-27 00:46:07 #自助法
在统计学中,自助法(Bootstrap Method,Bootstrapping,或自助抽样法)是一种从给定训练集中有放回的均匀抽样,也就是说,每当选中一个样本,它等可能地被再次选中并被再次添加到训练集中。自助法由Bradley Efron于1979年在《Annals of Statistics》上发表。当样本来自能以正态分布来描述的总体,其抽样分布(英语:Sampling Distribution)为正态分布;但当样本来自的总体无法以正态分布来描述,则以渐进分析法、自助法等来分析。采用随机可置换抽样(random sampling with replacement)。对于小数据集,自助法效果很好。最常用的一种是.632自助法,假设给定的数据集包含d个样本。该数据集有放回地抽样d次,产生d个样本的训练集。这样原数据样本中的某些样本很可能在该样本集中出现多次。没有进入该训练集的样本最终形成检验集(测试集)。
显然每个样本被选中的概率是1/d,因此未被选中的概率就是(1-1/d),这样一个样本在训练集中没出现的概率就是d次都未被选中的概率,即(1-1/d)d。当d趋于无穷大时,这一概率就将趋近于e-1=0.368,所以留在训练集中的样本大概就占原来数据集的63.2%。
相关
- 白介素-1结构 / ECOD介白素-1包括11种细胞因子,在机体控制免疫和炎症反应中具有重要作用。这些细胞因子的发现始于1943年至1948年间,Menkin和Beeson对兔子腹腔细胞释放的致热原蛋白质
- 血液检验项目血液检查(英语:Blood test),是指通过采血以获得受检者的血液,并利用其进行临床检查以获取受检者的健康状况。主要通过医检师进行检验。血液检查主要用于判断患者在一定时间内的身
- 屈折变化在语法学中,词形变化(又译作形态变化、屈折变化)(Inflection or inflexion)指单词(或词根)的变化,以导致语法功能改变,进而使其代表的意义也有所改变。印欧语屈折变化又可以分为变位
- 禸禸部,为汉字索引中的部首之一,康熙字典214个部首中的第一百一十四个(五划的则为第二十个)。就繁体和简体中文中,禸部归于五划部首。以下方为部字。且无其他部首可用者将部首归为
- 驱动蛋白驱动蛋白(英语:Kinesin)是一类蛋白质超级家族,属于分子马达的一种,其成员代表驱动蛋白-1(Kinesin-1)在1985年被发现。驱动蛋白是由单体组成的多聚体,其“头部”具有ATP酶活性,能通过
- 修复DNA修复是细胞中经常运行的一种进程。它使基因组免受损伤和突变,因此对细胞的生存是很重要的。在人的细胞中,一般的代谢活动和环境因素(如紫外线和放射线)都能造成DNA损伤,导致每
- 圣经中的酒《圣经》与酒的关系十分奇妙。酒精饮料屡次在圣经文学中出现——从希伯来圣经中诺亚栽种葡萄园、变成酒鬼,到新约圣经中耶稣在迦拿的婚礼中神奇地变出了大量的酒,还有后来在基
- 升华升华是指一种物质从固态不经过液态直接转化为气态的过程,是物质在温度和气压低于三相点的时候发生的一种物态变化。与升华相反的过程称做凝华,指物质从气态直接变成固态。这样
- 新布尼亚病毒新布尼亚病毒(SFTS Virus),又称发热伴血小板减少综合征病毒,是布尼亚病毒科白蛉病毒属(英语:Phlebovirus)的一种病毒,其引发的病症称为发热伴血小板减少综合征,为一种经由蜱虫传染给
- 湿婆派湿婆教(梵语:शैव पंथ,śaiva paṁtha,英语:Shaivism,Shaivam),又称湿婆派、希瓦派,原义是与湿婆合一,是印度教中四个最主要教派之一,尊崇湿婆为最高的神明。它的信徒被称为希瓦(Sh
