首页 >
自助法
✍ dations ◷ 2025-11-14 20:52:37 #自助法
在统计学中,自助法(Bootstrap Method,Bootstrapping,或自助抽样法)是一种从给定训练集中有放回的均匀抽样,也就是说,每当选中一个样本,它等可能地被再次选中并被再次添加到训练集中。自助法由Bradley Efron于1979年在《Annals of Statistics》上发表。当样本来自能以正态分布来描述的总体,其抽样分布(英语:Sampling Distribution)为正态分布;但当样本来自的总体无法以正态分布来描述,则以渐进分析法、自助法等来分析。采用随机可置换抽样(random sampling with replacement)。对于小数据集,自助法效果很好。最常用的一种是.632自助法,假设给定的数据集包含d个样本。该数据集有放回地抽样d次,产生d个样本的训练集。这样原数据样本中的某些样本很可能在该样本集中出现多次。没有进入该训练集的样本最终形成检验集(测试集)。
显然每个样本被选中的概率是1/d,因此未被选中的概率就是(1-1/d),这样一个样本在训练集中没出现的概率就是d次都未被选中的概率,即(1-1/d)d。当d趋于无穷大时,这一概率就将趋近于e-1=0.368,所以留在训练集中的样本大概就占原来数据集的63.2%。
相关
- NDL国立国会图书馆(日语:国立国会図書館/こくりつこっかいとしょかん Kokuritsu kokkai toshokan */?)是日本的国家图书馆,直接隶属于国会,除了主要为日本国会议员的调查、研究等立
- 子宫内膜炎子宫内膜炎(英语:Endometritis)是指发生于子宫内膜的炎症。子宫内膜炎分为急性与慢性两种,临床以前者较为常见,后著较为少见。急性子宫内膜炎是在子宫内膜腺体上有微脓肿或嗜中性
- 疾病预防控制中心CDC可以指:
- 弗雷格弗里德里希·路德维希·戈特洛布·弗雷格(德语:Friedrich Ludwig Gottlob Frege,宽式IPA:.mw-parser-output .IPA{font-family:"Charis SIL","Doulos SIL","Linux Libertine","S
- 肟.mw-parser-output ruby.zy{text-align:justify;text-justify:none}.mw-parser-output ruby.zy>rp{user-select:none}.mw-parser-output ruby.zy>rt{font-feature-settings:
- 火火部,为汉字索引中的部首之一,康熙字典214个部首中的第八十六个(四划的则为第二十六个)。就繁体和简体中文中,火部归于四划部首。火部通常是从上、下、左方均可为部字。当上方为
- 梵书梵书(天城体:ब्राह्मण,IAST:brāhmaṇa)是古印度的一种宗教文献。它的名称来自于词根bṛh,“增长,变大”。参考同源词:梵(brahman),婆罗门(brāhmaṇa),梵天(brahmā)。传统上将梵书
- 分支过程在概率论中,分支过程(英语:Branching Process)属于随机过程的一类,由一系列随机变量组成。分支过程的最初目的是建立一个数学模型,研究第n代个体产生随机个后代时的个体数模型。最
- 诱导性提问诱导性提问(suggestive question)或称暗示性问题,是指用不恰当的提问方式限缩、操控回答者的回答。诱导性提问往往会使答案不能确实反映回答者内心的真实想法。在问卷应用上,诱
- 草蜢总科:蚤蝼总科Tridactyloidea总科:区蚱总科Tetrigoidea总科:蜢总科Eumastacoidea总科:牛蝗总科Pneumoroidea总科:锥头蝗总科Pyrgomorphoidea总科:蝗总科Acridoidea总科:长角
