吉布斯采样

✍ dations ◷ 2025-11-26 10:42:53 #蒙地卡罗方法

吉布斯采样(英语:Gibbs sampling)是统计学中用于马尔科夫蒙特卡洛(MCMC)的一种算法,用于在难以直接采样时从某一多变量概率分布中近似抽取样本序列。该序列可用于近似联合分布、部分变量的边缘分布或计算积分(如某一变量的期望值)。某些变量可能为已知变量,故对这些变量并不需要采样。

吉布斯采样常用于统计推断(尤其是贝叶斯推断)之中。这是一种随机化算法,与最大期望算法等统计推断中的确定性算法相区别。与其他MCMC算法一样,吉布斯采样从马尔科夫链中抽取样本,可以看作是Metropolis–Hastings算法的特例。

该算法的名称源于约西亚·威拉德·吉布斯,由斯图尔特·杰曼(英语:Stuart Geman)与唐纳德·杰曼(英语:Donald Geman)兄弟于1984年提出。

吉布斯采样适用于条件分布比边缘分布更容易采样的多变量分布。假设我们需要从联合分布 p ( x 1 , , x n ) {\displaystyle p(x_{1},\dots ,x_{n})} 中抽取 X = ( x 1 , , x n ) {\displaystyle \mathbf {X} =(x_{1},\dots ,x_{n})} k {\displaystyle \left.k\right.} 个样本。记第 i {\displaystyle i} 个样本为 X ( i ) = ( x 1 ( i ) , , x n ( i ) ) {\displaystyle \mathbf {X} ^{(i)}=\left(x_{1}^{(i)},\dots ,x_{n}^{(i)}\right)} 。吉布斯采样的过程则为:

在采样完成后,我们可以用这些样本来近似所有变量的联合分布。如果仅考虑其中部分变量,则可以得到这些变量的边缘分布。此外,我们还可以对所有样本求某一变量的平均值来估计该变量的期望。

相关

  • 生育率这个条目包含2个不同数据来源的生育率列表。生育率是指理想状态下妇女育龄期生育的子女总数。列表1的数据来源于中情局《世界概况》,2018年版。列表2的数据来源于联合国人口
  • 尤皮克语尤皮克语(Yupik),阿拉斯加中西部和西伯利亚东北部尤皮克人所使用的语言,属于爱斯基摩-阿留申语系爱斯基摩语族。公元前2000年左右,阿留申语与爱斯基摩语开始分化。1000左右,尤皮克
  • 美国电影学院美国电影学会(英语:American Film Institute,简称AFI)成立于1967年,是美国国家艺术基金会创建的独立运作的非营利组织。1965年,美国总统林登·约翰逊发出派令,指定设立一个全国性的
  • 钴氰酸盐钴氰酸盐是三价钴的氰配合物,化学式为3−。钴氰酸盐性质较为稳定,在溶液中和盐酸、氢氧化钠和一些氧化剂(如H2O2、Cl2)呈惰性。
  • 蚌科见内文蚌科(学名:Unionidae),又名石蛤科或珠蚌科,是软体动物门双壳纲古异齿类一个淡水生的物种分支,也是现时蚌目之内最大的一个科,蚌总科之下四个科之一。受生长地带所限,本科物种
  • 胡 玫胡玫(1958年9月2日-),中国大陆女导演,中国电影集团一级导演,现任全国人大代表、全国文联委员、中国电视艺术家协会副主席。1982年毕业于北京电影学院导演系。前夫是导演苏舟,现夫是
  • 误植误植,也叫印刷错误或打字错误,最初是指在排版(字体排印学)时使用了错误的活字而印刷,至电脑普及之后也用来指称打字或拼写的错误。此用语包含指机械故障或失手造成的错误,但不包括
  • 北塘虾酱北塘虾酱起源于清朝,目前是中国天津市滨海新区北塘地区的一种传统民间小吃。北塘虾酱包括:“老北塘”家食白虾酱、麻线虾酱、对虾头酱、葱辣脆虾皮、虾油、及各种虾油小菜等,这
  • 威慑理论在冷战时期,在使用核武器方面的威慑理论作为一种军事战略获得了越来越多的重视。在这段期间里,它具有独特的意义,因为一个相对弱的(拥核)力量可以凭借其极端的破坏力量阻止另一个
  • 书呆子书呆子(或称“书虫”、“书痴”,古称“两脚书橱”),通常是指死读书的人,也就是虽然读了很多书,却缺乏实际知识,无法处理人际关系,且无法应用知识来处理事务的人。“书呆子”又叫“书