自助法

✍ dations ◷ 2025-04-02 09:04:24 #自助法
在统计学中,自助法(Bootstrap Method,Bootstrapping,或自助抽样法)是一种从给定训练集中有放回的均匀抽样,也就是说,每当选中一个样本,它等可能地被再次选中并被再次添加到训练集中。自助法由Bradley Efron于1979年在《Annals of Statistics》上发表。当样本来自能以正态分布来描述的总体,其抽样分布(英语:Sampling Distribution)为正态分布;但当样本来自的总体无法以正态分布来描述,则以渐进分析法、自助法等来分析。采用随机可置换抽样(random sampling with replacement)。对于小数据集,自助法效果很好。最常用的一种是.632自助法,假设给定的数据集包含d个样本。该数据集有放回地抽样d次,产生d个样本的训练集。这样原数据样本中的某些样本很可能在该样本集中出现多次。没有进入该训练集的样本最终形成检验集(测试集)。 显然每个样本被选中的概率是1/d,因此未被选中的概率就是(1-1/d),这样一个样本在训练集中没出现的概率就是d次都未被选中的概率,即(1-1/d)d。当d趋于无穷大时,这一概率就将趋近于e-1=0.368,所以留在训练集中的样本大概就占原来数据集的63.2%。

相关

  • 睾丸睾丸,俗称蛋,是雄性动物生殖器官及生殖腺的一部分。是女性卵巢的同源器官。主要作用是产生精子和分泌雄性激素(主要是睾酮)。睾酮的分泌是由脑垂腺前叶分泌的黄体成长激素所控制
  • 西欧西欧是指欧洲西半部,面积约500万平方公里,占欧洲的一半左右。习惯上,本区又可以分为北欧、西欧、南欧三部分。本区位于欧亚大陆西部、大西洋东岸,大部分位于北纬35°~60°属北温
  • LAC加拿大国家图书馆暨档案馆(英语:Library and Archives Canada,简称 LAC)是加拿大的国家图书馆与档案馆,位于首都渥太华。加拿大国家图书馆暨档案馆隶属于加拿大文化遗产部之下,是
  • 行星行星(英语:planet;拉丁语:planeta),通常指自身不发光,环绕着恒星的天体。其公转方向常与所绕恒星的自转方向相同(由西向东)。一般来说行星需具有一定质量,行星的质量要足够的大(相对于
  • 星形胶细胞星形胶质细胞,也称星状细胞(astrocyte、AS),为神经胶质细胞的一种。星形胶质细胞在大脑中的比例尚不明确。有研究发现,星形胶质细胞的比例因区域而异,占所有神经胶质细胞的20%至40%
  • 丽纹双门齿兽双门齿兽属(学名:Diprotodon),又名古草食有袋属,是最大的有袋类。它于160万年前出现,并于4万年前的更新世消失。双门齿兽的化石在澳洲很多地方都有发现,当中包括完整的骨骼及头颅骨
  • 希腊人列表希腊人按职业分类,可以从以下各列表中查询。
  • 奥夫曼朱尔·A·奥夫曼(法语:Jules A. Hoffmann,1941年8月2日-),出生于卢森堡埃希特纳赫,法国生物学家。法国国家科学研究中心管理委员会理事长,2007年成为法国科学院院长。因发现如何激活
  • 德国饮食文化德国饮食文化是指德国国内和日耳曼人的饮食习惯。德国由于身处欧洲大陆之中心,饮食文化与内陆地区之物产分布息息相关。整体上德国人较为爱好肉类。其中德国人非常爱吃猪肉,大
  • 阿伯丁坐标:57°09′09″N 2°06′36″W / 57.1526°N 2.1100°W / 57.1526; -2.1100阿伯丁(英语:Aberdeen i/æbərˈdiːn/;低地苏格兰语:Aiberdeen  listen 帮助·信息;苏格兰盖尔语