自助法

✍ dations ◷ 2025-12-09 03:55:05 #自助法
在统计学中,自助法(Bootstrap Method,Bootstrapping,或自助抽样法)是一种从给定训练集中有放回的均匀抽样,也就是说,每当选中一个样本,它等可能地被再次选中并被再次添加到训练集中。自助法由Bradley Efron于1979年在《Annals of Statistics》上发表。当样本来自能以正态分布来描述的总体,其抽样分布(英语:Sampling Distribution)为正态分布;但当样本来自的总体无法以正态分布来描述,则以渐进分析法、自助法等来分析。采用随机可置换抽样(random sampling with replacement)。对于小数据集,自助法效果很好。最常用的一种是.632自助法,假设给定的数据集包含d个样本。该数据集有放回地抽样d次,产生d个样本的训练集。这样原数据样本中的某些样本很可能在该样本集中出现多次。没有进入该训练集的样本最终形成检验集(测试集)。 显然每个样本被选中的概率是1/d,因此未被选中的概率就是(1-1/d),这样一个样本在训练集中没出现的概率就是d次都未被选中的概率,即(1-1/d)d。当d趋于无穷大时,这一概率就将趋近于e-1=0.368,所以留在训练集中的样本大概就占原来数据集的63.2%。

相关

  • 浮力浮力是指物体在流体(液体和气体)中受到的力,方向与其所受重力相反。浮力来自各表面受流体(液体和气体)压力的差(合力)。浮力的单位是牛顿(N)。相传叙拉古赫农王让工匠替他做了一顶纯
  • 帕德嫩神庙坐标:37°58′13″N 23°43′21″E / 37.97025°N 23.72247°E / 37.97025; 23.72247帕特农神庙(古希腊文:Παρθενών,现代希腊文:Παρθενώνας)兴建于公元前5世纪
  • 疾病转型流行病学转变(epidemiological transition)是人口学与医学地理学中的一个概念,是指人口随着医学的进步而快速增长,但之后又由于生育率的降低而使人口重新稳定下来。该理论由阿布
  • 哺乳纲哺乳动物是指脊椎动物亚门下哺乳纲(学名:Mammalia)的一类用肺呼吸空气的温血脊椎动物,因能通过乳腺分泌乳汁来给幼体哺乳而得名。按照《世界哺乳动物物种》(Mammal Species of th
  • 巴氏奶巴氏消毒法(法语:Pasteurisation),法国生物学家路易·巴斯德于1864年发明的消毒方法,原理是用60~90°C的短暂加热,来杀死液体中的微生物,以达到保质的效果;确切温度和时间依照液体的
  • 遗迹遗迹,又称遗址,是古代人类遗留下来的建筑物遗址与生活环境的遗址,属于考古学概念。例如:古代皇宫、陵墓、万里长城、金字塔、神社、寺庙、帕德嫩神庙等。大多遗址的特点表现为不
  • 姐妹染色单体交换姐妹分体交换(Sister chromatid exchange, 缩写 SCE),是两个同卵姐妹染色单体之间的基因材料交换。减数分裂中,一条来自父方,一条来自母方的染色体叫做同源染色体。同源染色体 两
  • 马萨诸塞马萨诸塞州(英语:Commonwealth of Massachusetts),简称麻省、麻州,正式名称为马萨诸塞联邦,是位于美国东北部的州,为美国独立时最初的十三州之一,也是新英格兰六州里人口最密集的一
  • 开元开元(713年十二月—741年十二月)为唐朝皇帝唐玄宗李隆基的年号,共计二十九年。开元意思是开辟新纪元。开元年间,唐朝国力处于最强盛的时期,史称开元盛世。
  • 欧文·朗缪尔欧文·朗缪尔(英语:Irving Langmuir,1881年1月31日-1957年8月16日),美国化学家、物理学家。他最知名的出版物是1919年发表的文章"电子在原子与分子中的排列"("The Arrangement of E