自助法

✍ dations ◷ 2025-12-08 14:46:10 #自助法
在统计学中,自助法(Bootstrap Method,Bootstrapping,或自助抽样法)是一种从给定训练集中有放回的均匀抽样,也就是说,每当选中一个样本,它等可能地被再次选中并被再次添加到训练集中。自助法由Bradley Efron于1979年在《Annals of Statistics》上发表。当样本来自能以正态分布来描述的总体,其抽样分布(英语:Sampling Distribution)为正态分布;但当样本来自的总体无法以正态分布来描述,则以渐进分析法、自助法等来分析。采用随机可置换抽样(random sampling with replacement)。对于小数据集,自助法效果很好。最常用的一种是.632自助法,假设给定的数据集包含d个样本。该数据集有放回地抽样d次,产生d个样本的训练集。这样原数据样本中的某些样本很可能在该样本集中出现多次。没有进入该训练集的样本最终形成检验集(测试集)。 显然每个样本被选中的概率是1/d,因此未被选中的概率就是(1-1/d),这样一个样本在训练集中没出现的概率就是d次都未被选中的概率,即(1-1/d)d。当d趋于无穷大时,这一概率就将趋近于e-1=0.368,所以留在训练集中的样本大概就占原来数据集的63.2%。

相关

  • 空窗期空窗期(英语:window period)在医学检验的领域中,指的是:“从生物体受到疾病感染 那一刻开始直到医学检验可有效侦测到生物体受到疾病感染那一刻为止”中间的时期。例如:一个生物体
  • 靛色系小孩靛蓝小孩是指被视为拥有某种特殊意志力或超自然能力的儿童、少年、青少年。靛色系小孩这个概念最早在李·卡罗与珍·托柏夫妇所写的The Indigo Children: The New Kids Have
  • 鲍氏傍人鲍氏傍人(学名:Paranthropus boisei)为人科傍人属的一种,是早期的人族及最大的傍人。他生存于260-120万年前上新世至更新世的东非。他最初被命名鲍氏东非人,及后被更名为鲍氏南方
  • 氟苯氟苯是有机化合物,分子式为C6H5F,通常简写为PhF。这种物质是苯的衍生物,氟原子与苯环直接相连。其熔点为-44℃,低于苯,这是由于氟取代基破坏苯环的对称性,使分子无法如未取代的苯
  • 油封鸭油封鸭(法语:confit de canard 法语读音:)是法国菜的一种烤鸭料理。在法国西南部的加斯科尼,就以延续油封鸭的传统而闻名,油封鸭被认为是最优秀的法国菜肴之一。油封鸭源自于法国
  • 细胞衣糖萼(也称为细胞外基质)是糖蛋白和糖脂覆盖物,其围绕在一些细菌,上皮细胞和其他细胞的细胞膜上。大多数动物上皮细胞在其质膜的外表面上具有类似绒毛的涂层。 该涂层由几种膜糖
  • 核苷酸磷酸盐核苷酸(英语:Nucleotide)是核酸的基本组成单位。核苷酸以一个含氮碱基为核心,加上一个五碳糖和一个或者多个磷酸基团组成。含氮碱基有五种,分别是腺嘌呤(A)、鸟嘌呤(G)、胞嘧啶(C)、胸
  • 斯托达特詹姆斯·弗雷泽·斯托达特爵士,FRS,FRSE,FRSC(英语:Fellow of the Royal Society of Chemistry)(英语:Sir James Fraser Stoddart,1942年5月24日-),苏格兰化学家,2016年凭借分子机器的设
  • 者勒蔑者勒蔑(蒙古语:.mw-parser-output .font-mong{font-family:"Menk Hawang Tig","Menk Qagan Tig","Menk Garqag Tig","Menk Har_a Tig","Menk Scnin Tig","Oyun Gurban Ulus Ti
  • 肌肉卫星细胞肌卫星细胞(Myosatellite cell)是一种位于骨骼肌中的细胞。肌卫星细胞呈扁平形,有突起,通常附着在肌纤维表面。当肌纤维受损伤后,肌卫星细胞可增殖分化,参与肌纤维的修复,具有干细