自助法

✍ dations ◷ 2024-12-22 18:14:31 #自助法
在统计学中,自助法(Bootstrap Method,Bootstrapping,或自助抽样法)是一种从给定训练集中有放回的均匀抽样,也就是说,每当选中一个样本,它等可能地被再次选中并被再次添加到训练集中。自助法由Bradley Efron于1979年在《Annals of Statistics》上发表。当样本来自能以正态分布来描述的总体,其抽样分布(英语:Sampling Distribution)为正态分布;但当样本来自的总体无法以正态分布来描述,则以渐进分析法、自助法等来分析。采用随机可置换抽样(random sampling with replacement)。对于小数据集,自助法效果很好。最常用的一种是.632自助法,假设给定的数据集包含d个样本。该数据集有放回地抽样d次,产生d个样本的训练集。这样原数据样本中的某些样本很可能在该样本集中出现多次。没有进入该训练集的样本最终形成检验集(测试集)。 显然每个样本被选中的概率是1/d,因此未被选中的概率就是(1-1/d),这样一个样本在训练集中没出现的概率就是d次都未被选中的概率,即(1-1/d)d。当d趋于无穷大时,这一概率就将趋近于e-1=0.368,所以留在训练集中的样本大概就占原来数据集的63.2%。

相关

  • 生物大分子生物大分子指的是作为生物体内主要活性成分的各种分子量达到上万或更多的有机分子。常见的生物大分子包括蛋白质、核酸 (DNA、RNA等)、糖类。这只是一个概念性定义,与生物大
  • 徐州医科大学徐州医科大学,坐落在中国历史文化名城江苏徐州市,是江苏省属本科高等医学院校。学校有4个校区,占地面积1200余亩。学校起始于1958年的南京医学院徐州分院,1959年江苏省新海连医
  • 南京人南京人,或称南京直立人和南京猿人,1990年代出土于南京汤山葫芦洞的南京人化石地点。目前有两例复原的南京猿人头骨。“南京猿人I号头骨”,为有病的成年女性,距今约58~62万年。“
  • 食蚜蝇见内文食蚜蝇(学名:Syrphidae)亦称花虻,是双翅目下的一科昆虫,外貌形似蜜蜂。成年的食蚜蝇主要以花蜜及花粉为食,经常会在花朵上停留,因此可替花授粉。食蚜蝇的幼虫外形似蛆,其食物
  • 美军亵渎古兰经事件美军亵渎古兰经事件,是发生于2005年的一系列美国军队人员亵渎《古兰经》的事件的总称,事件的曝光引发伊斯兰世界广泛的抗议,也招致世界对美国压制新闻自由的批评。据报道,事件发
  • 奥布省奥布省(法语:Aube)是法国大东部大区所辖的省份。该省编号为10。5个海外省及大区
  • 文化例外文化例外(台湾称作文化免议)是一种为了保护本国的文化不被其他文化侵袭而制定的一种政策。法国最早提出文化例外,许多国家采用文化例外原则虽然起到了一定的积极效果,但是总体上
  • 血管生成血管新生(英文:Angiogenesis)是一个生理上新的微血管发展成一个血流供应系统的过程。而Vasculogenesis通常指自发性的血管形成,另外Intussusception则是指较一般快速形成的血管
  • OCLC联机计算机图书馆中心(OCLC,全称:Online Computer Library Center,或译在线电脑图书馆中心、在线计算机图书馆中心)创建于1967年,最初名为俄亥俄学院图书馆中心(Ohio College Libra
  • 咖啡加工咖啡加工(Coffee Production)是一种将咖啡树的咖啡果转换为生咖啡豆商品的工业过程。过程中将咖啡果的果实或果肉去除,留下种子或豆子,并将之烘干。不同的加工方式会影响咖啡在