最大期望算法

✍ dations ◷ 2025-12-09 19:58:59 #估计理论,算法,机器学习算法

最大期望算法(Expectation-maximization algorithm,又译期望最大化算法)在统计中被用于寻找,依赖于不可观察的隐性变量的概率模型中,参数的最大似然估计。

在统计计算中,最大期望(EM)算法是在概率模型中寻找参数最大似然估计或者最大后验估计的算法,其中概率模型依赖于无法观测的隐变量。最大期望算法经常用在机器学习和计算机视觉的数据聚类(Data Clustering)领域。最大期望算法经过两个步骤交替进行计算,第一步是计算期望(E),利用对隐藏变量的现有估计值,计算其最大似然估计值;第二步是最大化(M),最大化在E步上求得的最大似然值来计算参数的值。M步上找到的参数估计值被用于下一个E步计算中,这个过程不断交替进行。

最大期望值算法由Arthur P. Dempster(英语:Arthur P. Dempster),Nan Laird(英语:Nan Laird)和Donald Rubin(英语:Donald Rubin)在他们1977年发表的经典论文中提出。他们指出此方法之前其实已经被很多作者“在他们特定的研究领域中多次提出过”。

EM算法用于在方程不能直接求解的情况下寻找统计模型的(局部)最大似然参数。这些模型中较为典型的是含有潜变量,未知参数并且已知观测数据的模型。也就是说,要么数据中存在缺失的值,要么模型可以通过假设存在更多未观测到的数据点来更简单地表示。以混合模型(Mixture Model)为例,通过假设每个观察到的数据点都有一个对应的未观察到的数据点,也可以说是潜在变量,来指定每个数据点所属的混合部分,这样就可以更简单地描述混合模型。

EM是一个在已知部分相关变量的情况下,估计未知变量的迭代技术。EM的算法流程如下:

我们用 y {\displaystyle {\textbf {y}}} 表示能够观察到的不完整的变量值,用 x {\displaystyle {\textbf {x}}} 表示无法观察到的变量值,这样 x {\displaystyle {\textbf {x}}} y {\displaystyle {\textbf {y}}} 一起组成了完整的数据。 x {\displaystyle {\textbf {x}}} 可能是实际测量丢失的数据,也可能是能够简化问题的隐藏变量,如果它的值能够知道的话。例如,在混合模型中,如果“产生”样本的混合元素成分已知的话最大似然公式将变得更加便利(参见下面的例子)。

p {\displaystyle p\,} 代表矢量 θ {\displaystyle \theta } : p ( y , x | θ ) {\displaystyle p(\mathbf {y} ,\mathbf {x} |\theta )} 定义的参数的全部数据的几率密度函数(连续情况下)或者几率质量函数(离散情况下),那么从这个函数就可以得到全部数据的最大似然值,另外,在给定的观察到的数据条件下未知数据的条件分布可以表示为:

相关

  • 玻意耳-马略特定律波意耳-马略特定律(英语:Boyle's law,也称作Boyle–Mariotte law或Mariotte's law),在定量定温下,理想气体的体积与压强成反比。是由爱尔兰化学家罗伯特·波义耳,在1662年根据实验
  • 恋爱DNA研究所X《恋爱DNA研究所X》(韩语:연애 DNA 연구소-X,英语: ),为韩国MBN电视台于2019年推出的综艺节目,由尹施允、BOOM、秀彬、郑素谭、申奉仙、MC Gree等人共同主持,节目主轴为帮助尽管表
  • 肉部,为汉字索引中的部首之一,康熙字典214个部首中的第一百三十个(六划的则为第十三个)。俗称提肉旁。就正体中文中,肉部归于六划部首。肉部通常以左、上、下方为部字。且无其他
  • 漫画书漫画书(英语:Comic book),常简称为漫画,有时亦称为小人书、连环图或漫画杂志。是一种由若干单独画面所构成的叙事性美术杂志或独立发行的书刊,常伴随着对话(常出现在语音气球中,而“
  • 国际防止核战争医生组织国际防止核战争医生组织(英语:International Physicians for the Prevention of Nuclear War,缩写IPPNW),又译为国际医生防止核战联盟,是一个由60多个国家医疗机构组成的国际组织
  • 野莓覆盆子(学名:Rubus idaeus)是蔷薇科悬钩子属的木本植物,其果实味道酸甜,植株的枝干上长有倒钩刺。覆盆子有很多别名,例如: 红桑子、 覆盆、覆盆莓、托盘(东北)、饽饽头(东北)、公饭(广东
  • 中华人民共和国财政部1999年规定:印章直径5厘米,中央刊国徽,由国务院制发。中华人民共和国财政部,是中华人民共和国国务院负责财政事务的组成部门。中华人民共和国财政部前身为1949年10月1日成立的
  • 约翰·施莱辛格约翰·理查·施莱辛格(英语:John Richard Schlesinger,CBE,1926年2月16日-2003年7月25日)是一位英国电影和舞台剧的导演和演员。曾经凭借《午夜牛郎》获得1969年第42届奥斯卡金像
  • 丹尼尔·托马斯·麦卡蒂丹尼尔·托马斯·麦卡蒂(Daniel T. McCarty,1912年1月18日-1953年9月28日),曾任第31任美国佛罗里达州州长。丹尼尔·麦卡蒂出身于佛罗里达州匹尔斯堡,是当地一个显赫家族的儿子,居
  • 富谷市富谷市(日语:富谷市/とみやし  */?),是日本宫城县中部的一市。