自助法

✍ dations ◷ 2025-11-28 05:10:28 #自助法
在统计学中,自助法(Bootstrap Method,Bootstrapping,或自助抽样法)是一种从给定训练集中有放回的均匀抽样,也就是说,每当选中一个样本,它等可能地被再次选中并被再次添加到训练集中。自助法由Bradley Efron于1979年在《Annals of Statistics》上发表。当样本来自能以正态分布来描述的总体,其抽样分布(英语:Sampling Distribution)为正态分布;但当样本来自的总体无法以正态分布来描述,则以渐进分析法、自助法等来分析。采用随机可置换抽样(random sampling with replacement)。对于小数据集,自助法效果很好。最常用的一种是.632自助法,假设给定的数据集包含d个样本。该数据集有放回地抽样d次,产生d个样本的训练集。这样原数据样本中的某些样本很可能在该样本集中出现多次。没有进入该训练集的样本最终形成检验集(测试集)。 显然每个样本被选中的概率是1/d,因此未被选中的概率就是(1-1/d),这样一个样本在训练集中没出现的概率就是d次都未被选中的概率,即(1-1/d)d。当d趋于无穷大时,这一概率就将趋近于e-1=0.368,所以留在训练集中的样本大概就占原来数据集的63.2%。

相关

  • 结节性硬化症结节性硬化症(英语:tuberous sclerosis complex,缩写作 TSC)是一种罕见的多系统先天性疾病,会在脑部、心脏、肾脏、皮肤及其他器官出现良性肿瘤,因此病患可能出现癫痫、发育迟缓或
  • 哈伯特顶点在1953年,美国地质学家哈伯特(King Hubbert)大胆预言,美国石油生产速率将于60年代末至70年代初左右达到顶峰,达到了顶峰之后就会一直下降。这种情形叫做哈伯特顶点(Hubbert's peak
  • 弗拉维奥·比翁多弗拉维奥·比翁多(英语:Flavio Biondo),(1392年-1463年),文艺复兴时期欧洲考古学家。为考古学研究的先驱。他在其所著的一本著作《论拉丁语》(1435年出版)中,他把意大利语和拉丁语两者
  • 因纽特人美国 阿拉斯加州  加拿大 西北地区、努纳齐亚福特(英语:Nunatsiavut)、 努纳武特地区、 魁北克、 育空地区  俄罗斯远东地区因纽特人(因纽特语:ᐃᓄᐃᑦ Inuit,或译为因努
  • 共同演化在生物学上,共演化是指“一项生物学的性质因另一项生物学的性质变化而随之变化”。共演化可以发生在许多生理学上的层次,如微观下蛋白质中氨基酸之序列,如巨观下不同生物的性状
  • σ轨道在化学与原子物理学中,σ轨道(英语:σ orbital、sigma orbital)是一种分子轨道。是形成σ键后所产生的分子轨道。σ轨道是一种由轨道端对端重叠所形成的新轨道。重叠的轨道可以
  • 茂金属茂金属(英语:metallocene)是一类有机金属化合物,典型的是由两个环戊二烯阴离子(茂基,简写为Cp,即C5H5-)和二价氧化态金属中心连接而成,通式为(C5H5)2M。与茂金属密切相关的为茂金属衍
  • 开元盛世开元之治,亦称为开元盛世和开天盛世,是唐朝在唐玄宗统治时期所出现的盛世。唐玄宗治国头三十年,以开元作为年号,那时玄宗励精图治,并且任用贤能,发展经济,提倡文教,使得天下大治,所以
  • 地理位置地理位置是指地球表面某一事物与其它事物间的空间关系。地理位置是地理事物的特殊属性,是地理事物的标志之一。任何地理事物的地理位置都是在一定的参照系中识别的,当参照系改
  • 电脑辅助设计电脑辅助设计(英语:Computer Aided Design, CAD)是指运用电脑软件制作并模拟实物设计,展现新开发商品的外型、结构、彩色、质感等特色的过程。随着技术的不断发展电脑辅助设计不