最大期望算法

✍ dations ◷ 2025-11-28 14:55:07 #估计理论,算法,机器学习算法

最大期望算法(Expectation-maximization algorithm,又译期望最大化算法)在统计中被用于寻找,依赖于不可观察的隐性变量的概率模型中,参数的最大似然估计。

在统计计算中,最大期望(EM)算法是在概率模型中寻找参数最大似然估计或者最大后验估计的算法,其中概率模型依赖于无法观测的隐变量。最大期望算法经常用在机器学习和计算机视觉的数据聚类(Data Clustering)领域。最大期望算法经过两个步骤交替进行计算,第一步是计算期望(E),利用对隐藏变量的现有估计值,计算其最大似然估计值;第二步是最大化(M),最大化在E步上求得的最大似然值来计算参数的值。M步上找到的参数估计值被用于下一个E步计算中,这个过程不断交替进行。

最大期望值算法由Arthur P. Dempster(英语:Arthur P. Dempster),Nan Laird(英语:Nan Laird)和Donald Rubin(英语:Donald Rubin)在他们1977年发表的经典论文中提出。他们指出此方法之前其实已经被很多作者“在他们特定的研究领域中多次提出过”。

EM算法用于在方程不能直接求解的情况下寻找统计模型的(局部)最大似然参数。这些模型中较为典型的是含有潜变量,未知参数并且已知观测数据的模型。也就是说,要么数据中存在缺失的值,要么模型可以通过假设存在更多未观测到的数据点来更简单地表示。以混合模型(Mixture Model)为例,通过假设每个观察到的数据点都有一个对应的未观察到的数据点,也可以说是潜在变量,来指定每个数据点所属的混合部分,这样就可以更简单地描述混合模型。

EM是一个在已知部分相关变量的情况下,估计未知变量的迭代技术。EM的算法流程如下:

我们用 y {\displaystyle {\textbf {y}}} 表示能够观察到的不完整的变量值,用 x {\displaystyle {\textbf {x}}} 表示无法观察到的变量值,这样 x {\displaystyle {\textbf {x}}} y {\displaystyle {\textbf {y}}} 一起组成了完整的数据。 x {\displaystyle {\textbf {x}}} 可能是实际测量丢失的数据,也可能是能够简化问题的隐藏变量,如果它的值能够知道的话。例如,在混合模型中,如果“产生”样本的混合元素成分已知的话最大似然公式将变得更加便利(参见下面的例子)。

p {\displaystyle p\,} 代表矢量 θ {\displaystyle \theta } : p ( y , x | θ ) {\displaystyle p(\mathbf {y} ,\mathbf {x} |\theta )} 定义的参数的全部数据的几率密度函数(连续情况下)或者几率质量函数(离散情况下),那么从这个函数就可以得到全部数据的最大似然值,另外,在给定的观察到的数据条件下未知数据的条件分布可以表示为:

相关

  • 巴门尼德爱利亚的巴门尼德(Παρμενίδης)(约前515-前445),公元前5世纪的古希腊哲学家,最重要的“前苏格拉底”哲学家之一,是埃利亚学派的一员。生于埃利亚(Ἐλέα,位于现在意大利南
  • 膜是许多不同的软的、皮质的隔绝层材料的总称。膜可以用来分隔不同的物质,也可以用来产生振动。膜的一个特性是在承受压力时只能够抵抗应力,并把它传到膜的边缘,这个特性的一个
  • 物种形成现代生物分类群体从它们的 共同祖先遗传分化的图示。进化论介绍(英语:Introduction to evolution) 演化的证据 共同起源 共同起源的证据群体遗传学 · 遗传多样性 突变 · 自
  • 亚硝酸根亚硝酸盐(Nitrite,NO2−)是亚硝酸组成的盐,主要指亚硝酸钠(NaNO2),含有亚硝酸根离子,化学式NO2−,有一对称阴离子与同等的N–O键长和大约120度的O–N–O键角。亚硝酸盐可被氧化或还原
  • MICMic或MIC可以指:
  • 伤齿龙伤齿龙属(属名:Troodon)又名锯齿龙,是种体型相当小、类似鸟类的恐龙,生存于晚白垩纪,约7500万年前到6500万年前。伤齿龙的化石是在1855年发现,是北美洲最早发现的恐龙之一。伤齿龙
  • 刘建中刘建中(1942年-),中国电影事业家,华夏电影发行有限责任公司董事长,原国家广播电影电视总局电影事业管理局局长、中国电影家协会原副主席,第十届全国政协委员。
  • 约翰·温梭普约翰·温斯罗普(英语:John Winthrop,1588年1月12日-1649年3月26日)1629年,温索普因清教信仰被剥夺公职。温索普是一位律师,毕业于剑桥大学,属于拥有土地的贵族。他购买了新成立的马
  • 波斯尼亚金字塔群波斯尼亚金字塔群是位于欧洲波斯尼亚维索科附近的一群角砾岩山。其中一座山丘名为维索西卡山,有欧洲的考古学家奥斯曼纳季奇认为它是古代金字塔。若是奥斯曼纳季奇的研究属实
  • 阿布鲁齐莫利塞区阿布鲁齐莫利塞区(Abruzzi e Molise)是意大利过去的一个行政区,面积约16,600平方公里。在1963年被划分为阿布鲁佐与莫利塞。坐标:42°21′N 13°24′E / 42.35°N 13.4°E / 42.