最大期望算法

✍ dations ◷ 2025-11-29 15:56:33 #估计理论,算法,机器学习算法

最大期望算法(Expectation-maximization algorithm,又译期望最大化算法)在统计中被用于寻找,依赖于不可观察的隐性变量的概率模型中,参数的最大似然估计。

在统计计算中,最大期望(EM)算法是在概率模型中寻找参数最大似然估计或者最大后验估计的算法,其中概率模型依赖于无法观测的隐变量。最大期望算法经常用在机器学习和计算机视觉的数据聚类(Data Clustering)领域。最大期望算法经过两个步骤交替进行计算,第一步是计算期望(E),利用对隐藏变量的现有估计值,计算其最大似然估计值;第二步是最大化(M),最大化在E步上求得的最大似然值来计算参数的值。M步上找到的参数估计值被用于下一个E步计算中,这个过程不断交替进行。

最大期望值算法由Arthur P. Dempster(英语:Arthur P. Dempster),Nan Laird(英语:Nan Laird)和Donald Rubin(英语:Donald Rubin)在他们1977年发表的经典论文中提出。他们指出此方法之前其实已经被很多作者“在他们特定的研究领域中多次提出过”。

EM算法用于在方程不能直接求解的情况下寻找统计模型的(局部)最大似然参数。这些模型中较为典型的是含有潜变量,未知参数并且已知观测数据的模型。也就是说,要么数据中存在缺失的值,要么模型可以通过假设存在更多未观测到的数据点来更简单地表示。以混合模型(Mixture Model)为例,通过假设每个观察到的数据点都有一个对应的未观察到的数据点,也可以说是潜在变量,来指定每个数据点所属的混合部分,这样就可以更简单地描述混合模型。

EM是一个在已知部分相关变量的情况下,估计未知变量的迭代技术。EM的算法流程如下:

我们用 y {\displaystyle {\textbf {y}}} 表示能够观察到的不完整的变量值,用 x {\displaystyle {\textbf {x}}} 表示无法观察到的变量值,这样 x {\displaystyle {\textbf {x}}} y {\displaystyle {\textbf {y}}} 一起组成了完整的数据。 x {\displaystyle {\textbf {x}}} 可能是实际测量丢失的数据,也可能是能够简化问题的隐藏变量,如果它的值能够知道的话。例如,在混合模型中,如果“产生”样本的混合元素成分已知的话最大似然公式将变得更加便利(参见下面的例子)。

p {\displaystyle p\,} 代表矢量 θ {\displaystyle \theta } : p ( y , x | θ ) {\displaystyle p(\mathbf {y} ,\mathbf {x} |\theta )} 定义的参数的全部数据的几率密度函数(连续情况下)或者几率质量函数(离散情况下),那么从这个函数就可以得到全部数据的最大似然值,另外,在给定的观察到的数据条件下未知数据的条件分布可以表示为:

相关

  • 乡药集成方《乡药集成方》是朝鲜医家卢重礼、俞孝通、朴允德等奉世宗之命,于1431-1443年间编撰的一部医书。该书以1399年朝鲜医家李希善所编撰的《乡药济生集成方》为蓝本,借鉴267部中国
  • 清双唇鼻音是辅音的一种,用于一些口语中。清双唇鼻音在国际音标的符号是 ⟨m̥⟩,X-SAMPA音标的符号则是m_0。当符号成对出现时,左边的是清音,右边的是浊音。阴影区域表示被认为
  • 1412年重要事件及趋势重要人物
  • 三鹿集团石家庄三鹿集团股份有限公司(简称三鹿集团)曾经是一家位于河北省石家庄市的中外合资企业,主要业务为奶牛饲养、乳品加工生产,主要经营产品为奶粉,其控股方是持股56%的石家庄三鹿
  • Ka波段1234567891011ELFSLFULFVLFLFMFHFVHFUHFSHFEHFABCDEFGHIJKLMHFVHFUHFLSCXKuKKaQVW根据IEEE 521-2002标准,Ka波段是指频率在26.5–40GHz的无线电波波段。Ka在德语中意为“Kur
  • 生物学的一切都没有道理,除非放在演化的光芒之下生物学的一切都没有道理,除非用演化的眼光来看。(英文:Nothing in Biology Makes Sense Except in the Light of Evolution)是演化生物学家和东正教教徒费奥多西·多布然斯基在1
  • 2004年印度尼西亚立法机构选举阿敏·莱斯(英语:Amien Rais) 国民使命党(英语:National Mandate Party)希达雅特·努尔·瓦希德(英语:Hidayat Nur Wahid) 繁荣公正党(英语:Prosperous Justice Party) 政治主题印度尼西
  • 0.999…在数学的完备实数系中,循环小数0.999…,也可写成 0. 9 ¯ {\displaystyle 0.{
  • 藤森昭一藤森昭一(日语:藤森 昭一/ふじもり しょういち ,1926年12月26日-2016年6月25日),日本官僚。曾担任日本赤十字社名誉社长。环境事务次官、内阁官房副长官、宫内厅长官、日本赤十字
  • 腺牧豆树 var. var. var. (Torr.)腺牧豆树(学名:)是牧豆树属下的一种植物。原产于美国西南部到墨西哥的地区内,而美国境内的腺牧豆树主要分布在堪萨斯州南部到德克萨斯州东部的年降