最大期望算法

✍ dations ◷ 2025-05-06 07:20:00 #估计理论,算法,机器学习算法

最大期望算法(Expectation-maximization algorithm,又译期望最大化算法)在统计中被用于寻找,依赖于不可观察的隐性变量的概率模型中,参数的最大似然估计。

在统计计算中,最大期望(EM)算法是在概率模型中寻找参数最大似然估计或者最大后验估计的算法,其中概率模型依赖于无法观测的隐变量。最大期望算法经常用在机器学习和计算机视觉的数据聚类(Data Clustering)领域。最大期望算法经过两个步骤交替进行计算,第一步是计算期望(E),利用对隐藏变量的现有估计值,计算其最大似然估计值;第二步是最大化(M),最大化在E步上求得的最大似然值来计算参数的值。M步上找到的参数估计值被用于下一个E步计算中,这个过程不断交替进行。

最大期望值算法由Arthur P. Dempster(英语:Arthur P. Dempster),Nan Laird(英语:Nan Laird)和Donald Rubin(英语:Donald Rubin)在他们1977年发表的经典论文中提出。他们指出此方法之前其实已经被很多作者“在他们特定的研究领域中多次提出过”。

EM算法用于在方程不能直接求解的情况下寻找统计模型的(局部)最大似然参数。这些模型中较为典型的是含有潜变量,未知参数并且已知观测数据的模型。也就是说,要么数据中存在缺失的值,要么模型可以通过假设存在更多未观测到的数据点来更简单地表示。以混合模型(Mixture Model)为例,通过假设每个观察到的数据点都有一个对应的未观察到的数据点,也可以说是潜在变量,来指定每个数据点所属的混合部分,这样就可以更简单地描述混合模型。

EM是一个在已知部分相关变量的情况下,估计未知变量的迭代技术。EM的算法流程如下:

我们用 y {\displaystyle {\textbf {y}}} 表示能够观察到的不完整的变量值,用 x {\displaystyle {\textbf {x}}} 表示无法观察到的变量值,这样 x {\displaystyle {\textbf {x}}} y {\displaystyle {\textbf {y}}} 一起组成了完整的数据。 x {\displaystyle {\textbf {x}}} 可能是实际测量丢失的数据,也可能是能够简化问题的隐藏变量,如果它的值能够知道的话。例如,在混合模型中,如果“产生”样本的混合元素成分已知的话最大似然公式将变得更加便利(参见下面的例子)。

p {\displaystyle p\,} 代表矢量 θ {\displaystyle \theta } : p ( y , x | θ ) {\displaystyle p(\mathbf {y} ,\mathbf {x} |\theta )} 定义的参数的全部数据的几率密度函数(连续情况下)或者几率质量函数(离散情况下),那么从这个函数就可以得到全部数据的最大似然值,另外,在给定的观察到的数据条件下未知数据的条件分布可以表示为:

相关

  • 四级结构蛋白质四级结构(英语:Protein quaternary structure)是生物化学中用于描述多亚基蛋白质复合物中各个折叠蛋白质亚基的排列组合。许多蛋白质实际上是多个多肽链的组装。 四级结
  • Maurice莫里斯或莫瑞斯可以指:
  • 罗德巨人乐天巨人(韩语:롯데 자이언츠、英语:Lotte Giants),是KBO联赛的球队之一,母企业为知名的跨国企业乐天集团,成立于1982年,为韩国职棒创始的六支球团之一,主场地为位于釜山广域市的社稷
  • 阜部阜部,为汉字索引中的部首之一,康熙字典214个部首中的第一百七十个(八划的则为第四个)。就繁体和简体中文中,阜部归于八划部首。阜部只以左方为部字,俗称“左耳旁”或“左耳刀”。
  • 阿尔弗雷德·拉德克利夫-布朗1881年9月17日 英国伯明翰1955年10月24日 英国伦敦阿尔弗雷德·拉德克利夫-布朗(Alfred Radcliffe-Brown,原名Alfred Brown,1881年9月17日-1955年10月24日),英国人类学家,结构功能
  • 轨道离心率在天文动力学,架构在标准假说下的任何轨道都必须是圆锥切面的形状。圆锥切面的离心率,轨道离心率是定义轨道形状的重要参数,而且定义了绝对的形状。离心率可以解释为形状从圆形
  • 菲尔·莱斯特菲利普·麦可·“菲尔”·莱斯特(Philip Michael "Phil" Lester,1987年1月30日-),活跃于YouTube的英国影片部落客(YouTuber)以及电台广播主持人。2006年3月27日,莱斯特利用他从玉米
  • 古文 (消歧义)古文可能指:
  • 爱情万万岁 (韩国电视剧)《爱情万万岁》(韩语:애정만만세,英语:Bravo, My Love!),为韩国MBC自2011年7月16日起制播的周末特别计划剧。請回答1997
  • 王际真王际真 (英语:Chi-chen Wang, 1899年-2001年)是一位美籍华人学者和翻译家。1899年出生在山东桓台县,父亲王采廷(1877—1952),字贡忱,是光绪癸卯科进士。考取清华学校留美预备名额前