最大期望算法

✍ dations ◷ 2025-11-04 05:34:24 #估计理论,算法,机器学习算法

最大期望算法(Expectation-maximization algorithm,又译期望最大化算法)在统计中被用于寻找,依赖于不可观察的隐性变量的概率模型中,参数的最大似然估计。

在统计计算中,最大期望(EM)算法是在概率模型中寻找参数最大似然估计或者最大后验估计的算法,其中概率模型依赖于无法观测的隐变量。最大期望算法经常用在机器学习和计算机视觉的数据聚类(Data Clustering)领域。最大期望算法经过两个步骤交替进行计算,第一步是计算期望(E),利用对隐藏变量的现有估计值,计算其最大似然估计值;第二步是最大化(M),最大化在E步上求得的最大似然值来计算参数的值。M步上找到的参数估计值被用于下一个E步计算中,这个过程不断交替进行。

最大期望值算法由Arthur P. Dempster(英语:Arthur P. Dempster),Nan Laird(英语:Nan Laird)和Donald Rubin(英语:Donald Rubin)在他们1977年发表的经典论文中提出。他们指出此方法之前其实已经被很多作者“在他们特定的研究领域中多次提出过”。

EM算法用于在方程不能直接求解的情况下寻找统计模型的(局部)最大似然参数。这些模型中较为典型的是含有潜变量,未知参数并且已知观测数据的模型。也就是说,要么数据中存在缺失的值,要么模型可以通过假设存在更多未观测到的数据点来更简单地表示。以混合模型(Mixture Model)为例,通过假设每个观察到的数据点都有一个对应的未观察到的数据点,也可以说是潜在变量,来指定每个数据点所属的混合部分,这样就可以更简单地描述混合模型。

EM是一个在已知部分相关变量的情况下,估计未知变量的迭代技术。EM的算法流程如下:

我们用 y {\displaystyle {\textbf {y}}} 表示能够观察到的不完整的变量值,用 x {\displaystyle {\textbf {x}}} 表示无法观察到的变量值,这样 x {\displaystyle {\textbf {x}}} y {\displaystyle {\textbf {y}}} 一起组成了完整的数据。 x {\displaystyle {\textbf {x}}} 可能是实际测量丢失的数据,也可能是能够简化问题的隐藏变量,如果它的值能够知道的话。例如,在混合模型中,如果“产生”样本的混合元素成分已知的话最大似然公式将变得更加便利(参见下面的例子)。

p {\displaystyle p\,} 代表矢量 θ {\displaystyle \theta } : p ( y , x | θ ) {\displaystyle p(\mathbf {y} ,\mathbf {x} |\theta )} 定义的参数的全部数据的几率密度函数(连续情况下)或者几率质量函数(离散情况下),那么从这个函数就可以得到全部数据的最大似然值,另外,在给定的观察到的数据条件下未知数据的条件分布可以表示为:

相关

  • 阿拉伯沙漠阿拉伯沙漠是占据阿拉伯半岛的大部分区域的沙漠,由也门延伸至波斯湾、阿曼至约旦及伊拉克。其中心为空虚地带,世上最大的沙体之一。瞪羚、剑羚、沙猫和王者蜥为生存于此一极限
  • 国耻演说国耻演说是由美国第三十二任总统富兰克林·罗斯福于1941年12月8日,即珍珠港事件后一天,向美国国会联席会议所发表的演说。此演说得名于它的第一段:罗斯福将前一天描述为“一个
  • 混溶混溶(有时又称作无限互溶)是溶质与溶剂以任意的比例混合皆可均匀溶解的现象。基本上这个词可以用在任何的相(液体、固体及气体),但用在液体上较为普遍。常见的例子有酒精与水;油
  • 秘书局中国人民解放军军徽中国共产党中央军事委员会办公厅秘书局,位于北京市,是中央军委办公厅下属局,负责该办公厅的秘书工作。中央军委办公厅秘书局的前身是中央军委办公厅秘书处。
  • 西班牙皇家语言学院西班牙皇家语言学院(西班牙语:Real Academia Española,简称RAE)是西班牙王室设立的一个机构,负责翻译西班牙语。总部设在马德里,座右铭是“它清理、修复,并创造辉煌”(Limpia, fija
  • 合成钻石合成钻石或称人造钻石,即透过技术加工制成的钻石,对比于地质作用自然形成的天然钻石。合成钻石也广泛被称作HPHT钻石和CVD钻石,分别表示它的加工方式:高温高压(High-Pressure Hig
  • 亚硫酸氢钠亚硫酸氢钠(化学式:NaHSO3)是一种无机化合物,只能在溶液中存在。其在空气中易被氧化为硫酸盐。亚硫酸氢钠与活泼醛、酮发生加成反应,生成亚硫酸氢钠加合物。该反应可用来避免羰基
  • 陈思谦 (嘉靖进士)陈思谦,广东潮州府揭阳县人,明朝政治人物、同进士出身。嘉靖二年(1526年)丙戌科进士,任户部主事。陈思谦家谱及后裔
  • 天木直人天木直人(1947年7月19日-)是一名知名日本外交官、作家和政治评论家,互联网政党‘新党宪法9条’发起人、日本驻黎巴嫩大使。出身于山口县下关市,先后就读洛星高等学校和京都大学,二
  • 所信表明演说所信表明演说(日语:所信表明演説/しょしんひょうめいえんぜつ  ?)是日本行政机关首长对自己施政信念发表的公开演讲,多半是在国会、议会、或地方自治体对外。在国会是由总理在