最大期望算法

✍ dations ◷ 2025-12-06 21:51:03 #估计理论,算法,机器学习算法

最大期望算法(Expectation-maximization algorithm,又译期望最大化算法)在统计中被用于寻找,依赖于不可观察的隐性变量的概率模型中,参数的最大似然估计。

在统计计算中,最大期望(EM)算法是在概率模型中寻找参数最大似然估计或者最大后验估计的算法,其中概率模型依赖于无法观测的隐变量。最大期望算法经常用在机器学习和计算机视觉的数据聚类(Data Clustering)领域。最大期望算法经过两个步骤交替进行计算,第一步是计算期望(E),利用对隐藏变量的现有估计值,计算其最大似然估计值;第二步是最大化(M),最大化在E步上求得的最大似然值来计算参数的值。M步上找到的参数估计值被用于下一个E步计算中,这个过程不断交替进行。

最大期望值算法由Arthur P. Dempster(英语:Arthur P. Dempster),Nan Laird(英语:Nan Laird)和Donald Rubin(英语:Donald Rubin)在他们1977年发表的经典论文中提出。他们指出此方法之前其实已经被很多作者“在他们特定的研究领域中多次提出过”。

EM算法用于在方程不能直接求解的情况下寻找统计模型的(局部)最大似然参数。这些模型中较为典型的是含有潜变量,未知参数并且已知观测数据的模型。也就是说,要么数据中存在缺失的值,要么模型可以通过假设存在更多未观测到的数据点来更简单地表示。以混合模型(Mixture Model)为例,通过假设每个观察到的数据点都有一个对应的未观察到的数据点,也可以说是潜在变量,来指定每个数据点所属的混合部分,这样就可以更简单地描述混合模型。

EM是一个在已知部分相关变量的情况下,估计未知变量的迭代技术。EM的算法流程如下:

我们用 y {\displaystyle {\textbf {y}}} 表示能够观察到的不完整的变量值,用 x {\displaystyle {\textbf {x}}} 表示无法观察到的变量值,这样 x {\displaystyle {\textbf {x}}} y {\displaystyle {\textbf {y}}} 一起组成了完整的数据。 x {\displaystyle {\textbf {x}}} 可能是实际测量丢失的数据,也可能是能够简化问题的隐藏变量,如果它的值能够知道的话。例如,在混合模型中,如果“产生”样本的混合元素成分已知的话最大似然公式将变得更加便利(参见下面的例子)。

p {\displaystyle p\,} 代表矢量 θ {\displaystyle \theta } : p ( y , x | θ ) {\displaystyle p(\mathbf {y} ,\mathbf {x} |\theta )} 定义的参数的全部数据的几率密度函数(连续情况下)或者几率质量函数(离散情况下),那么从这个函数就可以得到全部数据的最大似然值,另外,在给定的观察到的数据条件下未知数据的条件分布可以表示为:

相关

  • 双鞭毛生物无根虫门 Apusozoa 泛植物 Archaeplastida 有孔虫界 Rhizaria 囊泡藻界 Chromalveolata双鞭毛生物是其真核细胞具有两个鞭毛的一种生物,是真核生物的两大类群之一。双鞭毛生
  • 乙醛酸循环体乙醛酸循环体(Glyoxysome)是在植物中发现的特殊过氧化物酶体(特别是在发芽种子的脂肪储存组织中),也能在丝状真菌中发现。含有脂肪和油的种子包括玉米,大豆,向日葵,花生和南瓜。乙
  • 吞并奥地利德奥合并(德语:Anschluss ,意指联合或政治联盟,也称为Anschluss Österreichs;同样指德奥合并),是1938年3月11日纳粹德国与奥地利第一共和国统一,组成大德意志的事件。一个历史渊源
  • 行政院公共工程委员会行政院公共工程委员会,简称工程会,成立于1995年7月20日,是中华民国监督政府工程建设的中央部会。工程会组改大逆转 中时电子报2012-8-15
  • 佛舞龙佛舞龙属(属名:Shanag)是驰龙科恐龙的一属,生存于白垩纪早期的蒙古。模式种是奥希佛舞龙(S. ashile),是在2007年由艾伦·特纳(Alan H. Turner)、马克·诺瑞尔(Mark Norell)等人叙述、命
  • 松下直树松下直树(1978年6月6日-),前日本足球运动员。
  • 阿部彬名阿部彬名(1980年4月15日-),日本女性声优。出身于东京都,旧名为阿部 幸恵(あべ さちえ)。2014年6月30日退出Tori Tori Office事务所,目前所属于三木制作(日语:三木プロダクション)。※粗
  • MindjetMindjet(原名:MindManager、MindMan)是由Mindjet公司开发的一款商业项目管理的应用程序,可以让用户通过思维导图的方法进行可视化的知识管理。截至2011年12月,Mindjet拥有约200万
  • 小泉源一小泉源一(日语:小泉 源一 ,1953年12月21日-1883年11月1日),日本植物学家,专攻蔷薇属、梅亚科(Rosaceae)、枫属(Aceraceae)、桑树属(mulberries),以及其他植物物种。他的名字,有时音译为“G
  • 上海钻石交易所上海钻石交易所(英语:Shanghai Diamond Exchange,缩写:SDE),于2000年10月27日经中国国务院批准成立,是中国大陆唯一的钻石进出口交易平台。上海钻石交易所为会员制,权利机构为会员大