首页 >
自助法
✍ dations ◷ 2025-11-28 11:40:07 #自助法
在统计学中,自助法(Bootstrap Method,Bootstrapping,或自助抽样法)是一种从给定训练集中有放回的均匀抽样,也就是说,每当选中一个样本,它等可能地被再次选中并被再次添加到训练集中。自助法由Bradley Efron于1979年在《Annals of Statistics》上发表。当样本来自能以正态分布来描述的总体,其抽样分布(英语:Sampling Distribution)为正态分布;但当样本来自的总体无法以正态分布来描述,则以渐进分析法、自助法等来分析。采用随机可置换抽样(random sampling with replacement)。对于小数据集,自助法效果很好。最常用的一种是.632自助法,假设给定的数据集包含d个样本。该数据集有放回地抽样d次,产生d个样本的训练集。这样原数据样本中的某些样本很可能在该样本集中出现多次。没有进入该训练集的样本最终形成检验集(测试集)。
显然每个样本被选中的概率是1/d,因此未被选中的概率就是(1-1/d),这样一个样本在训练集中没出现的概率就是d次都未被选中的概率,即(1-1/d)d。当d趋于无穷大时,这一概率就将趋近于e-1=0.368,所以留在训练集中的样本大概就占原来数据集的63.2%。
相关
- 环境污染控制环境污染控制是控制污染物排放的手段,包括污染物排放控制技术和控制污染物排放政策两个主要方面。技术一般由企业或科研机构去研发,按照市场机制运行,主要以配合污染控制政策为
- 模式模式(英语:Pattern,源自法语:patron),在物体或事件上,产生的一种规律变化与自我重复的样式之过程。在模式之中,某些固定的元素不断以可预测的方式周期性重现。最基本而常见的模式,称
- 自由变异自由变异(free variation、自由变体)在语言学上是指两个(或多个)有所差异的语音或语词出现在相同的情境中、这两者(或多者)又可互相替代使用,而母语的使用者认为这二者(或多者)含有相
- 东吴东吴可以指:
- 芬那酸芬那酸(Fenamic acid),是一系列非类固醇消炎止痛药的基本组成分子,衍生的药物包括甲芬那酸、托芬那酸(英语:tolfenamic acid)、氟芬那酸(英语:flufenamic acid)及甲氯芬那酸(英语:meclof
- 寒武纪寒武纪(Cambrian,符号Ꞓ)是显生宙的开始,距今约541百万年前—485.4百万年前。其名称来自于英国威尔士的一个古代地名罗马名称“Cambria”,该地的寒武纪地层被最早研究。中文名称
- 周期素周期蛋白(英语:Cyclin)是一个借由周期蛋白依赖性激酶调节细胞周期的蛋白质家族。简单来讲,细胞周期可以分为四个阶段:G0/G1、S、G2及M。G1和G2期是细胞生长期;S期是细胞将细胞核内
- 奥古斯塔市奥古斯塔(英语:Augusta)是美国佐治亚州的其中一个城市。高尔夫美国名人赛的举办场地奥古斯塔高尔夫球俱乐部位于这里。历史 | 经济 | 地理 | 州长亚特兰大阿普林县 | 阿特
- 北京同步辐射装置北京正负电子对撞机(英语:Beijing Electron Positron Collider,缩写:BEPC)是中国第一台高能粒子加速器,始建于1984年,位于北京西郊八宝山东侧。2004年至2009年间是重大的改造工程(称
- 古希腊宗教节庆:庞提克大草原高加索地区东亚东欧南欧庞提克大草原北方/东方大草原欧洲地区南亚地区西伯利亚大草原欧洲高加索地区印度印度-雅利安民族伊朗民族欧洲民族东亚印欧民族欧洲
