自助法

✍ dations ◷ 2025-12-04 07:43:38 #自助法
在统计学中,自助法(Bootstrap Method,Bootstrapping,或自助抽样法)是一种从给定训练集中有放回的均匀抽样,也就是说,每当选中一个样本,它等可能地被再次选中并被再次添加到训练集中。自助法由Bradley Efron于1979年在《Annals of Statistics》上发表。当样本来自能以正态分布来描述的总体,其抽样分布(英语:Sampling Distribution)为正态分布;但当样本来自的总体无法以正态分布来描述,则以渐进分析法、自助法等来分析。采用随机可置换抽样(random sampling with replacement)。对于小数据集,自助法效果很好。最常用的一种是.632自助法,假设给定的数据集包含d个样本。该数据集有放回地抽样d次,产生d个样本的训练集。这样原数据样本中的某些样本很可能在该样本集中出现多次。没有进入该训练集的样本最终形成检验集(测试集)。 显然每个样本被选中的概率是1/d,因此未被选中的概率就是(1-1/d),这样一个样本在训练集中没出现的概率就是d次都未被选中的概率,即(1-1/d)d。当d趋于无穷大时,这一概率就将趋近于e-1=0.368,所以留在训练集中的样本大概就占原来数据集的63.2%。

相关

  • J01FA·B·C·D·G·H·QI·J·L·M·N·P·R·S·VATC代码J01(抗菌药)是解剖学治疗学及化学分类系统的一个药物分组,这是由世界卫生组织药物统计方法整合中心(The WHO Collaboratin
  • 知觉异常心理学 行为遗传学 生物心理学 心理药物学 认知心理学 比较心理学 跨文化心理学 文化心理学 差异心理学(英语:Differential psychology) 发展心理学 进化心理学 实验心理学
  • 圣索菲亚大教堂圣索菲亚大教堂(希腊语:Ἁγία Σοφία;拉丁语:Sancta Sapientia;土耳其语:Ayasofya)是位于现今土耳其伊斯坦布尔的宗教建筑,有近一千五百年的漫长历史,因其巨大的圆顶而闻名于
  • 信息技术信息技术(英语:Information Technology,缩写:IT)也称信息和通信技术(Information and Communications Technology,ICT),是主要用于管理和处理信息所采用的各种技术总称,主要是应用计算
  • 胃肠道出血消化道出血(英语:gastrointestinal bleed (GI bleed)、gastrointestinal hemorrhage)是口腔至直肠之间任何部位的消化道出血。当短时间内大量出血时,可能导致的症状包含呕血、吐
  • 粪口路径粪口路径(也称为口腔-粪便路径或者口粪路径),是一种疾病传播(英语:Transmission (medicine))途径。具体指的是,病原体由一个宿主的粪便中被引入另一个宿主的口腔中的传播方式。在一
  • ClFOsub3/sub高氯酰氟是具有化学式ClFO3的活泼气体,具有类似于汽油和煤油的独特甜味。有毒,是一种强大的氧化剂和氟化剂。是高氯酸的酸性氟化物 。尽管高氯酰氟的生成焓( ΔHf°=-5.2千卡/
  • 福建人福建人可以指:
  • 托马斯·赫胥黎托马斯·亨利·赫胥黎,FRS(英语:Thomas Henry Huxley,1825年5月4日-1895年6月29日),英国生物学家,因捍卫查尔斯·达尔文的进化论而有“达尔文的斗牛犬”之称。他为了对抗理查·欧文
  • 贯穿性脊髓炎贯穿形脊髓炎是由脊髓发炎而导致的、影响到整个一段脊髓的病症,这种炎症将损害轴突,产生脱髓鞘作用、进一步导致中枢神经系统电阻率下降。没影响到整个脊髓的则叫做部分性脊髓