最大期望算法

✍ dations ◷ 2025-12-08 11:47:27 #估计理论,算法,机器学习算法

最大期望算法(Expectation-maximization algorithm,又译期望最大化算法)在统计中被用于寻找,依赖于不可观察的隐性变量的概率模型中,参数的最大似然估计。

在统计计算中,最大期望(EM)算法是在概率模型中寻找参数最大似然估计或者最大后验估计的算法,其中概率模型依赖于无法观测的隐变量。最大期望算法经常用在机器学习和计算机视觉的数据聚类(Data Clustering)领域。最大期望算法经过两个步骤交替进行计算,第一步是计算期望(E),利用对隐藏变量的现有估计值,计算其最大似然估计值;第二步是最大化(M),最大化在E步上求得的最大似然值来计算参数的值。M步上找到的参数估计值被用于下一个E步计算中,这个过程不断交替进行。

最大期望值算法由Arthur P. Dempster(英语:Arthur P. Dempster),Nan Laird(英语:Nan Laird)和Donald Rubin(英语:Donald Rubin)在他们1977年发表的经典论文中提出。他们指出此方法之前其实已经被很多作者“在他们特定的研究领域中多次提出过”。

EM算法用于在方程不能直接求解的情况下寻找统计模型的(局部)最大似然参数。这些模型中较为典型的是含有潜变量,未知参数并且已知观测数据的模型。也就是说,要么数据中存在缺失的值,要么模型可以通过假设存在更多未观测到的数据点来更简单地表示。以混合模型(Mixture Model)为例,通过假设每个观察到的数据点都有一个对应的未观察到的数据点,也可以说是潜在变量,来指定每个数据点所属的混合部分,这样就可以更简单地描述混合模型。

EM是一个在已知部分相关变量的情况下,估计未知变量的迭代技术。EM的算法流程如下:

我们用 y {\displaystyle {\textbf {y}}} 表示能够观察到的不完整的变量值,用 x {\displaystyle {\textbf {x}}} 表示无法观察到的变量值,这样 x {\displaystyle {\textbf {x}}} y {\displaystyle {\textbf {y}}} 一起组成了完整的数据。 x {\displaystyle {\textbf {x}}} 可能是实际测量丢失的数据,也可能是能够简化问题的隐藏变量,如果它的值能够知道的话。例如,在混合模型中,如果“产生”样本的混合元素成分已知的话最大似然公式将变得更加便利(参见下面的例子)。

p {\displaystyle p\,} 代表矢量 θ {\displaystyle \theta } : p ( y , x | θ ) {\displaystyle p(\mathbf {y} ,\mathbf {x} |\theta )} 定义的参数的全部数据的几率密度函数(连续情况下)或者几率质量函数(离散情况下),那么从这个函数就可以得到全部数据的最大似然值,另外,在给定的观察到的数据条件下未知数据的条件分布可以表示为:

相关

  • 昭昭天命昭昭天命(英语:Manifest Destiny,又译:天命论、天命观、天命昭彰、昭彰天命、天定命运论、美国天命论、天赋使命观、上帝所命、神授天命、命定扩张论、昭示的命运、天赋命运),为一
  • Erythrina刺桐属(学名:Erythrina)是蝶形花科下的一个属,为乔木或灌木植物。该属共有约200种,分布于全球的热带和亚热带地区。
  • 短发VT引信炮弹近炸引信(英语:Proximity fuze,日语:近接信管),亦称近爆引信或近发引信,是一种依据与目标距离而决定引爆的雷管。近炸引信的技术可被应用在火炮炮弹、火箭、水雷或鱼雷之上。第二次
  • 詹姆斯·冈恩 (天文学家)詹姆斯·爱德华·冈恩(英语:James Edward Gunn,1938年10月21日-),美国天文学家,普林斯顿大学尤金·希金斯天文学教授。冈恩的早期理论工作建立了对星系形成、星系际空间性质的当前
  • 2014年NBA季后赛2014年NBA季后赛是国家篮球协会(NBA)于2013-14 NBA赛季结束后进行的第68届NBA季后赛,赛程共2个月。下列日期以美国当地时间计算。各联盟的前四名种子由各赛区排名第一的球队和
  • 2015年亚洲沙滩足球锦标赛2015年亚足联沙滩足球锦标赛是2015年3月23日至28日在卡塔尔多哈举行的沙滩足球锦标赛 这是亚足联沙滩足球锦标赛连续第二次在多哈举行。 所有比赛都在卡塔拉海滩进行。本次
  • 克里斯蒂安·玻尔克里斯蒂安·哈拉尔德·劳里茨·彼得·埃米尔·玻尔(英语:Christian Harald Lauritz Peter Emil Bohr,1855年–1911年,生于哥本哈根)是一名丹麦医生,且是物理学家兼诺贝尔奖得主尼
  • 摩尔多瓦语言和民族问题摩尔多瓦语言和民族问题是指在摩尔多瓦共和国主要民族认同和母语认同的问题。摩尔多瓦人在摩尔多瓦共和国的民族认同意见分歧,摩尔多瓦人是罗马尼亚人的一部分还是与罗马尼亚
  • A21公路A21公路、A21高速公路可以指:
  • 卢梭木科参见正文卢梭木科又名毛岛藤灌科、腕带花科或四粉花科等,共有4属13种,from New Guinea to New ZealandMauritius分布在新几内亚、澳大利亚东部、新西兰和毛里求斯。1981年的克