首页 >
自助法
✍ dations ◷ 2025-11-25 19:06:39 #自助法
在统计学中,自助法(Bootstrap Method,Bootstrapping,或自助抽样法)是一种从给定训练集中有放回的均匀抽样,也就是说,每当选中一个样本,它等可能地被再次选中并被再次添加到训练集中。自助法由Bradley Efron于1979年在《Annals of Statistics》上发表。当样本来自能以正态分布来描述的总体,其抽样分布(英语:Sampling Distribution)为正态分布;但当样本来自的总体无法以正态分布来描述,则以渐进分析法、自助法等来分析。采用随机可置换抽样(random sampling with replacement)。对于小数据集,自助法效果很好。最常用的一种是.632自助法,假设给定的数据集包含d个样本。该数据集有放回地抽样d次,产生d个样本的训练集。这样原数据样本中的某些样本很可能在该样本集中出现多次。没有进入该训练集的样本最终形成检验集(测试集)。
显然每个样本被选中的概率是1/d,因此未被选中的概率就是(1-1/d),这样一个样本在训练集中没出现的概率就是d次都未被选中的概率,即(1-1/d)d。当d趋于无穷大时,这一概率就将趋近于e-1=0.368,所以留在训练集中的样本大概就占原来数据集的63.2%。
相关
- 列文虎克安东尼‧菲利普斯·范‧列文虎克(荷兰语:Antonie Philips van Leeuwenhoek;1632年10月24日-1723年8月26日)是一位荷兰贸易商与科学家,有光学显微镜与微生物学之父的称号。最为著名
- 社会阶层实证主义 · 反实证主义(英语:Antipositivism) 结构主义 · 冲突理论 中层理论 · 形式理论 批判理论人口 · 团体 · 组织(英语:Organizational theory) · 社会化 社会性
- 化学物理学化学物理学是化学和物理学的交叉学科,借助原子与分子物理学和凝聚态物理学中的理论方法和实验技术,研究物理化学现象的学科,是从物理学观点研究化学过程的物理学分支学科。化学
- 围墙封闭平台(closed platform),或称围墙花园(walled garden),是指一种软件系统,其中的电信运营商或服务供应商拥有控制应用、内容与媒体的能力,并能限制未经允许的应用或内容被轻易接取
- 生铁生铁是碳的质量分数超过2%,并且其他元素的含量不超过表1中所规定的极限值的铁-碳合金。a 含量比该极限值高的材料是铁合金。b 凡规定有最低含量或者含量超过表2注b中段落4)所
- 中间偏右中间偏右,又称中右翼,是用来描述政治观点在政治光谱上横跨中间派与右派,但不包含极右派立场的个人、政党、组织及智库。许多中间偏右政党内有各种派系存在。“中间偏右”没有精
- BBC广播大楼BBC广播大楼(英语:Broadcasting House),是英国广播公司的总部所在地,位于伦敦的波特兰坊。广播大楼动工于1928年,在1932年完工。1932年3月15日,第一个在广播大楼制作的广播节目对外
- 北海油田北海油田是世界著名的石油集中出产区,每日生产大约600万桶。位于大西洋的陆缘海——北海,它是介于欧洲大不列颠岛、挪威和欧洲大陆之间,所出产之石油为沿岸英国,挪威,丹麦和荷兰
- 石钟慈石钟慈(1933年12月-),中国计算数学家,中国科学院院士。1933年12月生于宁波。1955年,毕业于复旦大学数学系。1956年,为中国首批赴苏联进修学者,攻读计算数学。1960年,回国,任职于中国科
- 犬 (消歧义)犬是犬科哺乳动物狼的一个亚种。犬还可以指:
