首页 >
自助法
✍ dations ◷ 2025-09-06 16:52:17 #自助法
在统计学中,自助法(Bootstrap Method,Bootstrapping,或自助抽样法)是一种从给定训练集中有放回的均匀抽样,也就是说,每当选中一个样本,它等可能地被再次选中并被再次添加到训练集中。自助法由Bradley Efron于1979年在《Annals of Statistics》上发表。当样本来自能以正态分布来描述的总体,其抽样分布(英语:Sampling Distribution)为正态分布;但当样本来自的总体无法以正态分布来描述,则以渐进分析法、自助法等来分析。采用随机可置换抽样(random sampling with replacement)。对于小数据集,自助法效果很好。最常用的一种是.632自助法,假设给定的数据集包含d个样本。该数据集有放回地抽样d次,产生d个样本的训练集。这样原数据样本中的某些样本很可能在该样本集中出现多次。没有进入该训练集的样本最终形成检验集(测试集)。
显然每个样本被选中的概率是1/d,因此未被选中的概率就是(1-1/d),这样一个样本在训练集中没出现的概率就是d次都未被选中的概率,即(1-1/d)d。当d趋于无穷大时,这一概率就将趋近于e-1=0.368,所以留在训练集中的样本大概就占原来数据集的63.2%。
相关
- DIHP邻苯二甲酸二异庚酯(英语:Diisoheptyl phthalate)是一种邻苯二甲酸酯,由一个邻苯二甲酸和两个异庚醇酯化形成,化学式为 C22H34O4,常作为塑化剂使用。
- 二氧化氮二氧化氮(化学式:NO2),是氮氧化物之一。室温下为有刺激性气味的红棕色顺磁性气体,易溶于水,溶于水部分生成硝酸和一氧化氮。二氧化氮吸入后对肺组织具有强烈的刺激性和腐蚀性。作
- 建筑设备建筑设备指所有适用于房间和建筑的技术措施,包括经营场所和公共场所的能源(采暖,照明)和供应(水,空气)或废物排放(污水,垃圾)。其目的是对居民和用户提供建筑物的正常使用和必要的安全
- 杜贝莱约阿希姆·杜·贝莱(英语:Joachim du Bellay, 1522年-1560年),文艺复兴时期欧洲诗人。他为七星诗社的成员,1549年发表最早的法语彼特拉克的十四行诗。其著作包括拉丁语诗歌和讽刺
- 李依依李依依(1933年10月10日-),女,生于北京,原籍江苏苏州,中国冶金与金属材料科学家。生于北京。原籍江苏苏州。1957年毕业于北京钢铁工业学院冶金系。1999年当选为第三世界科学院院士。
- 三卤甲烷三卤甲烷是甲烷的四个氢中的三个被卤素取代基所取代的化合物。很多三卤甲烷在工业上被用作溶剂或制冷剂,也被认为是致癌物质。三卤甲烷也是污染环境的物质。另外,三个卤素取代
- 主持主持人是负责场所或节目、仪式等各式项目的主持者,为掌控事项进度及气氛的幕前负责人。
- 中美洲统合体中美洲统合体(西班牙语:Sistema de la Integración Centroamericana,缩写为SICA)于1991年12月13日成立,是一个中美洲国家政府间的组织。该组织以观察员身份受邀参与联合国大会,并
- 科学 (中国杂志)《科学》杂志是中国科学社以美国科学促进会(AAAS)及其科学杂志为模式创办的杂志。1915年1月首期《科学》月刊在上海由商务印书馆出版,发刊词上“科学”与“民权”赫然并列,申明
- 数字版权管理数字版权管理(英语:Digital rights management,DRM)是一系列访问控制技术,通常用于控制数字内容和设备在被销售之后的使用过程。DRM有时也称为拷贝保护、复制控制、技术保护措施