首页 >
自助法
✍ dations ◷ 2025-12-03 03:16:41 #自助法
在统计学中,自助法(Bootstrap Method,Bootstrapping,或自助抽样法)是一种从给定训练集中有放回的均匀抽样,也就是说,每当选中一个样本,它等可能地被再次选中并被再次添加到训练集中。自助法由Bradley Efron于1979年在《Annals of Statistics》上发表。当样本来自能以正态分布来描述的总体,其抽样分布(英语:Sampling Distribution)为正态分布;但当样本来自的总体无法以正态分布来描述,则以渐进分析法、自助法等来分析。采用随机可置换抽样(random sampling with replacement)。对于小数据集,自助法效果很好。最常用的一种是.632自助法,假设给定的数据集包含d个样本。该数据集有放回地抽样d次,产生d个样本的训练集。这样原数据样本中的某些样本很可能在该样本集中出现多次。没有进入该训练集的样本最终形成检验集(测试集)。
显然每个样本被选中的概率是1/d,因此未被选中的概率就是(1-1/d),这样一个样本在训练集中没出现的概率就是d次都未被选中的概率,即(1-1/d)d。当d趋于无穷大时,这一概率就将趋近于e-1=0.368,所以留在训练集中的样本大概就占原来数据集的63.2%。
相关
- 伊庇鲁斯同盟伊庇鲁斯同盟,又称伊庇鲁斯联邦 (西北希腊语: Κοινὸν Ἀπειρωτᾶν ),是一个古代希腊联邦式国家,前身一开始是摩罗西亚人的摩罗西亚同盟,在前330年左右纳入其他伊庇鲁
- 妇女神学妇女神学是一个建立在几个不同宗教,包括:佛教、基督教、犹太教及新思想运动等的运动,旨在使用女性主义角度去反思宗教的传统、实践、经文以及神学。有些妇女神学的目的是为了提
- 阿道夫·布特南特阿道夫·弗里德里希·约翰·布特南特(德语:Adolf Friedrich Johann Butenandt,1903年3月24日-1995年1月18日)是一位德国化学家。1903年生于不来梅逝于慕尼黑,1939年获诺贝尔化学奖
- 彳彳部,为汉字索引里为部首之一,康熙字典214个部首中的第六十个(三划的则为第三十一个)。就中文而言,彳部归于三划部首。彳部通常是从左方为部字。且无其他部首可用者将部首归为彳
- 千禧中国鸟龙中国鸟龙属(属名:Sinornithosaurus,意为“中国的鸟蜥蜴”),是种驰龙科的有羽毛恐龙,化石发现于中国的义县组,年代为下白垩纪的中巴列姆阶。中国鸟龙是第五个发现的有羽毛恐龙,并且在
- 真核翻译真核翻译(Eukaryotic translation)是信使RNA在真核生物中翻译成蛋白质的生物学过程。 它由四个阶段组成:起始,延伸,终止,和再循环。翻译起始是翻译过程中的第一步,也是最为复杂的
- NOCl亚硝酰氯(化学式:NOCl)是一个常见的亚硝酰盐。室温下为不稳定的黄色气体,具刺鼻恶臭味,遇水分解,可溶于发烟硫酸中。存在于王水中。用作催化剂、有机化学试剂,也用于合成洗涤剂。具
- 副驾驶副机师(英文:First Officer,缩写:FO)亦称副机长、副驾驶,可以分为初级和高级,职级比机长低,惟资历不一定比机长浅。副驾驶是航机内拥有第二指挥权的人,权力次于机长。副驾驶肩章上拥
- 戚正武戚正武(1932年4月10日-),宁波鄞县人。生物化学家,中国科学院院士,第三世界科学院院士。1952年,毕业于上海同济大学化学系。1959年,获苏联莫斯科医学院生物化学研究所副博士学位。1
- 多瑙河多瑙河(德文:Donau)是欧洲第二大河,次于俄罗斯的伏尔加河,发源于德国黑森林地区,最后注入黑海,全长2857千米,流域面积81.7万平方千米,平均流量为6500立方米/秒。多瑙河是中东欧极为重
