自助法

✍ dations ◷ 2025-10-16 05:44:43 #自助法
在统计学中,自助法(Bootstrap Method,Bootstrapping,或自助抽样法)是一种从给定训练集中有放回的均匀抽样,也就是说,每当选中一个样本,它等可能地被再次选中并被再次添加到训练集中。自助法由Bradley Efron于1979年在《Annals of Statistics》上发表。当样本来自能以正态分布来描述的总体,其抽样分布(英语:Sampling Distribution)为正态分布;但当样本来自的总体无法以正态分布来描述,则以渐进分析法、自助法等来分析。采用随机可置换抽样(random sampling with replacement)。对于小数据集,自助法效果很好。最常用的一种是.632自助法,假设给定的数据集包含d个样本。该数据集有放回地抽样d次,产生d个样本的训练集。这样原数据样本中的某些样本很可能在该样本集中出现多次。没有进入该训练集的样本最终形成检验集(测试集)。 显然每个样本被选中的概率是1/d,因此未被选中的概率就是(1-1/d),这样一个样本在训练集中没出现的概率就是d次都未被选中的概率,即(1-1/d)d。当d趋于无穷大时,这一概率就将趋近于e-1=0.368,所以留在训练集中的样本大概就占原来数据集的63.2%。

相关

  • 北冰洋北冰洋(英语:Arctic Ocean)又称北极海、北大洋,北极洋,位于北极圈内,大致以北极点为中心。北冰洋是世界五大洋中最小最浅的。面积1405.6万平方公里,约占世界大洋面积的3.6%。平均深
  • 薄壁组织薄壁组织是植物中的活营养组织,由薄壁细胞组成,在植物体内其总体积最大。薄壁组织分布于植物所有器官,例如根部的皮层、叶肉细胞与形成层。外界水分及溶解其中的离子可以自由通
  • 韧皮部韧皮部是维管植物的输导组织,负责将光合作用的产物——葡萄糖,由进行光合作用的器官运输到植物的其他部位;或由储存养分的器官运输到需要能量的器官(双向运输)由筛分子,薄壁组织和
  • 矛部,为汉字索引中的部首之一,康熙字典214个部首中的第一百一十个(五划的则为第十六个)。就繁体和简体中文中,矛部归于五划部首。矛部通常从左、下方为部字。且无其他部首可用者
  • TremellomycetesCystofilobasidiales 线黑粉菌目 Filobasidiales 银耳目 Tremellales银耳纲(Tremellomycetes)为双形性真菌,且某些物种有凝胶状的子实体或囊状的桶孔覆垫。
  • X光衍射图照片51(Photo 51)是1952年由罗莎琳·富兰克林所拍摄的一张DNA之X光衍射图片,是解出DNA结构的关键证据。此照片拍摄于伦敦国王学院,当时富兰克林为约翰·蓝道尔团队成员。她的同
  • 广州大学城广州大学城(英文:Guangzhou Higher Education Mega Center,简称为HEMC,建设时称“广州地区高校新校区”项目”)是位于中国广东省广州市的一个大学园区,位于番禺区的小谷围岛,面积17
  • 威廉·华兹华斯威廉·华兹华斯(William Wordsworth,1770年4月7日-1850年4月23日),英国浪漫主义诗人,与雪莱、拜伦齐名,也是湖畔诗人的代表。其代表作有与塞缪尔·泰勒·柯勒律治合著的《抒情歌谣
  • 兰德纸草书莱因德数学纸草书(又译作林德数学手卷;Rhind Mathematical Papyrus),也称阿姆士(Ahmose)纸草书,或者大英博物馆10057和10058号纸草书,是古埃及第二中间期时代(约前1650年)由僧侣阿姆士
  • 陈列平陈列平(1960年-),生于福建省福州市,美籍华裔免疫学家,肿瘤免疫疗法先驱,PD-L1第一发现人,中央研究院院士。现担任耶鲁大学医学院UTC癌症研究讲席教授。1982年本科毕业于福建医学院(现