首页 >
自助法
✍ dations ◷ 2025-11-20 07:13:46 #自助法
在统计学中,自助法(Bootstrap Method,Bootstrapping,或自助抽样法)是一种从给定训练集中有放回的均匀抽样,也就是说,每当选中一个样本,它等可能地被再次选中并被再次添加到训练集中。自助法由Bradley Efron于1979年在《Annals of Statistics》上发表。当样本来自能以正态分布来描述的总体,其抽样分布(英语:Sampling Distribution)为正态分布;但当样本来自的总体无法以正态分布来描述,则以渐进分析法、自助法等来分析。采用随机可置换抽样(random sampling with replacement)。对于小数据集,自助法效果很好。最常用的一种是.632自助法,假设给定的数据集包含d个样本。该数据集有放回地抽样d次,产生d个样本的训练集。这样原数据样本中的某些样本很可能在该样本集中出现多次。没有进入该训练集的样本最终形成检验集(测试集)。
显然每个样本被选中的概率是1/d,因此未被选中的概率就是(1-1/d),这样一个样本在训练集中没出现的概率就是d次都未被选中的概率,即(1-1/d)d。当d趋于无穷大时,这一概率就将趋近于e-1=0.368,所以留在训练集中的样本大概就占原来数据集的63.2%。
相关
- 在试管内In vitro是拉丁语中“在玻璃里”的意思,意指进行或发生于试管内的实验与实验技术。更广义的意思,则指活生物体之外的环境中的操作。常见的例子是人工受精。在细胞生物学等领域
- ICD-9-CM人体解剖学 - 人体生理学 组织学 - 胚胎学 人体寄生虫学 - 免疫学 病理学 - 病理生理学 细胞学 - 营养学 流行病学 - 药理学 - 毒理学国际疾病与相关健康问题统计分类(英语:I
- 劳亚大陆劳亚大陆(英文名:Laurasia)又译劳拉西亚大陆,为地质史古陆之一,存在于侏罗纪到白垩纪。劳亚大陆包含现今北半球大部分陆地。由劳伦大陆、波罗地大陆、西伯利亚大陆、哈萨克大陆、
- 数码物理学数字物理学(Digital physics)、或计算宇宙学(Computational universe),是一个理论,指宇宙可以用信息来代表,亦可以被计算。宇宙可能只是是疑似的电脑程序,或数字模拟物。数字物理学
- 时装时装(英文:Fashion),一般指某时期流行的时尚服装,包配服装配饰在内,配饰一般包括例如伞、眼镜、手袋、首饰等等所有配戴在个人身上的东西,令时装不再局限于衣服,开阔了其广度。纽约
- 煲/沸腾沸腾是在液体表面和内部同时发生的剧烈汽化现象。是物质从液态转变为气态的两种相变方式之一,另一种是蒸发。当液体上方的气压等于液体的饱和蒸汽压时,液体就会开始沸腾。如果
- 劳伦斯县劳伦斯县(Laurens County, Georgia)是美国乔治亚州中南部的一个县。面积2,120平方公里。根据美国2000年人口普查,共有人口44,874人。2005年人口46,896人。县治都柏林(Dublin)。成
- 司马法清孙星衍《平津馆丛书》所收的影宋本《孙吴司马法》 清人所辑《司马法逸文》 1935年中华学艺社影宋刻《武经七书》中收录 丁氏八千卷楼藏刘寅《武经七书直解》影印本《司马
- 中国战争列表中国自古以来内部或对外具有重大影响的战事列表,战事名称以大中华地区使用者为准,后面附上时间为该战进行时间或中方参战时间,每场战争名词下方为该战简介。中国有明确记载确实
- 於崇文中国科学院院士(地学部,1995年)於崇文(1924年2月15日-),生于上海,原籍浙江宁波,中国地球化学动力学家、矿床地球化学家,中国科学院院士。1991年,获李四光地质科学奖。1995年,当选为中国
