最大期望算法

✍ dations ◷ 2025-12-09 00:03:31 #估计理论,算法,机器学习算法

最大期望算法(Expectation-maximization algorithm,又译期望最大化算法)在统计中被用于寻找,依赖于不可观察的隐性变量的概率模型中,参数的最大似然估计。

在统计计算中,最大期望(EM)算法是在概率模型中寻找参数最大似然估计或者最大后验估计的算法,其中概率模型依赖于无法观测的隐变量。最大期望算法经常用在机器学习和计算机视觉的数据聚类(Data Clustering)领域。最大期望算法经过两个步骤交替进行计算,第一步是计算期望(E),利用对隐藏变量的现有估计值,计算其最大似然估计值;第二步是最大化(M),最大化在E步上求得的最大似然值来计算参数的值。M步上找到的参数估计值被用于下一个E步计算中,这个过程不断交替进行。

最大期望值算法由Arthur P. Dempster(英语:Arthur P. Dempster),Nan Laird(英语:Nan Laird)和Donald Rubin(英语:Donald Rubin)在他们1977年发表的经典论文中提出。他们指出此方法之前其实已经被很多作者“在他们特定的研究领域中多次提出过”。

EM算法用于在方程不能直接求解的情况下寻找统计模型的(局部)最大似然参数。这些模型中较为典型的是含有潜变量,未知参数并且已知观测数据的模型。也就是说,要么数据中存在缺失的值,要么模型可以通过假设存在更多未观测到的数据点来更简单地表示。以混合模型(Mixture Model)为例,通过假设每个观察到的数据点都有一个对应的未观察到的数据点,也可以说是潜在变量,来指定每个数据点所属的混合部分,这样就可以更简单地描述混合模型。

EM是一个在已知部分相关变量的情况下,估计未知变量的迭代技术。EM的算法流程如下:

我们用 y {\displaystyle {\textbf {y}}} 表示能够观察到的不完整的变量值,用 x {\displaystyle {\textbf {x}}} 表示无法观察到的变量值,这样 x {\displaystyle {\textbf {x}}} y {\displaystyle {\textbf {y}}} 一起组成了完整的数据。 x {\displaystyle {\textbf {x}}} 可能是实际测量丢失的数据,也可能是能够简化问题的隐藏变量,如果它的值能够知道的话。例如,在混合模型中,如果“产生”样本的混合元素成分已知的话最大似然公式将变得更加便利(参见下面的例子)。

p {\displaystyle p\,} 代表矢量 θ {\displaystyle \theta } : p ( y , x | θ ) {\displaystyle p(\mathbf {y} ,\mathbf {x} |\theta )} 定义的参数的全部数据的几率密度函数(连续情况下)或者几率质量函数(离散情况下),那么从这个函数就可以得到全部数据的最大似然值,另外,在给定的观察到的数据条件下未知数据的条件分布可以表示为:

相关

  • 牛血清白蛋白]牛血清白蛋白(Bovine Serum Albumin, BSA),又称第五组分,是牛血清中的一种球蛋白,包含583个氨基酸残基,分子量为66.5 kDa,等电点为4.7。牛血清白蛋白在生化实验中有广泛的应用,例如
  • 蛤蜊详细分类参看帘蛤目条目蛤蜊(注音:ㄍㄜˊ ㄌㄧˊ 汉语拼音:gé lí),常被误写为蛤蛎,也称为蛤、文蛤、西施舌、蚌、
  • 亚历山大·皮丘希金亚历山大·尤里耶维奇·皮丘希金(俄语:Алекса́ндр Ю́рьевич Пичу́шкин,英语:Alexander Yuryevich Pichushkin,1974年4月9日-)在莫斯科时间2006年6月16
  • 金弘集金弘集(1842年-1896年),字敬能,号道园、以政学斋,原名金宏集;本籍庆尚道庆州,谥号忠献(충헌),赠大提学,朝鲜王朝后期的政治人物,亲日派,俄馆播迁时被巡检处死。金弘集出身庆州金氏,是肃宗仁
  • 建筑理论建筑理论主要研究多种代表性的建筑观念和建筑思想,各种思潮之间的发展脉络和关联,建筑理论发展史; 解剖建筑理论所包含的观念与时代的价值取向和知识体系建构之间的关联性;研究
  • 吮阳右|无框 咂阳(英语:fellatio、fellation、俗称:blowjob、giving head、sucking off),或称“吮阳”,俗称吹箫,是口交的其中一种形式,当中从事者的口部或喉咙会跟一名男性或自己的阴茎
  • 孔肠科孔肠科(学名: Opecoelidae)是斜睾目之下一个吸虫纲复殖亚纲寄生虫的科,是复殖亚纲之下物种最丰盛的一个科,包含有近100个属、接近900个物种。这上千种物种全在淡水和咸水生活的真
  • BlogshopBlogshop由blog和shop二字组成,意思分别为部落格和商店,Blogshop即为以部落格平台建立的网络商店或网站。其架站工具为内容管理系统(如:WordPress、Drupal、Joomla!、Blogger),需
  • 光辉的祖国《光辉的祖国》(朝鲜语:빛나는 조국 )是一首朝鲜歌曲,被称为朝鲜的“第二国歌”,朴世永作词,李冕相作曲。日本殖民统治结束后,朝鲜半岛即陷入分裂状态。1946年,北朝鲜人民委员会委
  • 1924年冬季奥林匹克运动会英国代表团1924年冬季奥林匹克运动会英国代表团参加了在法国的霞慕尼举办的1924年冬奥会。奥地利 · 比利时 · 加拿大 · 捷克斯洛伐克 · 芬兰 · 法国 · 英国 · 匈牙利