自助法

✍ dations ◷ 2025-11-25 02:53:12 #自助法
在统计学中,自助法(Bootstrap Method,Bootstrapping,或自助抽样法)是一种从给定训练集中有放回的均匀抽样,也就是说,每当选中一个样本,它等可能地被再次选中并被再次添加到训练集中。自助法由Bradley Efron于1979年在《Annals of Statistics》上发表。当样本来自能以正态分布来描述的总体,其抽样分布(英语:Sampling Distribution)为正态分布;但当样本来自的总体无法以正态分布来描述,则以渐进分析法、自助法等来分析。采用随机可置换抽样(random sampling with replacement)。对于小数据集,自助法效果很好。最常用的一种是.632自助法,假设给定的数据集包含d个样本。该数据集有放回地抽样d次,产生d个样本的训练集。这样原数据样本中的某些样本很可能在该样本集中出现多次。没有进入该训练集的样本最终形成检验集(测试集)。 显然每个样本被选中的概率是1/d,因此未被选中的概率就是(1-1/d),这样一个样本在训练集中没出现的概率就是d次都未被选中的概率,即(1-1/d)d。当d趋于无穷大时,这一概率就将趋近于e-1=0.368,所以留在训练集中的样本大概就占原来数据集的63.2%。

相关

  • 退伍军人菌属Legionella adelaidensis Legionella anisa Legionella beliardensis Legionella birminghamensis Legionella bozemanii Legionella brunensis Legionella busanensis Legi
  • 黏液层黏液层(slime layer)为一种细菌的特殊构造,它是围绕细菌细胞的一层很容易除去(比如通过离心的方法),而且无规则的物质。黏液层的主要化学成分为外多糖、糖蛋白,以及糖脂。值得注意
  • 中央健康保险局署本部:10634台北市大安区信义路三段140号 台北业务组:10041台北市中正区公园路15-1号5楼 北区业务组:32005桃园市中坜区中山东路三段525号 中区业务组:40709台中市西屯区市政北
  • 茶醉茶醉也叫醉茶,指过量饮茶或饮茶太浓而引起的不适现象,尤其身体虚弱和空腹者,以及不常喝或没喝过浓茶、咖啡因含量较高的茶的人士比较容易出现。导致茶醉的物质是茶中所含之咖啡
  • 韦斯顿电池韦斯顿电池是一种原电池,1893年由英国化学家爱德华·韦斯顿(Edward Weston)发明。由于其高度稳定的电动势,多用于实验室中电位计的校准。1911年该电池被采纳为电动势的国际标准
  • 旅游地理学旅游地理学是研究人类旅行游览与地理环境关系的一门学科。旅游地理学不仅同地理学的许多分支学科的关系密切,而且与多门学科彼此渗透。如:社会学、民俗学、考古学、历史学、建
  • 特殊奥林匹克运动会特殊奥林匹克运动会(英文:Special Olympics)是为智能障碍者所设计的国际体育竞赛。特殊奥运会每两年举行一次,夏季及冬季交替举行。特殊奥林匹克运动会由尤妮丝·肯尼迪·史瑞佛
  • 血常规全血细胞计数(英文:complete blood count,CBC; full blood count,FBC),又称为血常规、血象、血细胞分析、血液细胞分析、血细胞计数 或 血液细胞计数,是医生或其他医学专业人员常常
  • 阿尔及利亚独立战争阿尔及利亚战争是1954年至1962年期间阿尔及利亚争取独立的武装力量与法国之间的战争,最终法国同意阿尔及利亚独立。美国政府支持法国维持他们的殖民地。贾迈勒·阿卜杜-纳赛
  • 阎锡蕴阎锡蕴(1957年2月-),中国纳米生物学家。河南开封人,1983年毕业于河南医学院(今郑州大学医学部),1993年获德国海德堡大学医学博士学位。担任中国科学院生物物理研究所研究员、蛋白质