最大期望算法

✍ dations ◷ 2025-12-01 05:42:03 #估计理论,算法,机器学习算法

最大期望算法(Expectation-maximization algorithm,又译期望最大化算法)在统计中被用于寻找,依赖于不可观察的隐性变量的概率模型中,参数的最大似然估计。

在统计计算中,最大期望(EM)算法是在概率模型中寻找参数最大似然估计或者最大后验估计的算法,其中概率模型依赖于无法观测的隐变量。最大期望算法经常用在机器学习和计算机视觉的数据聚类(Data Clustering)领域。最大期望算法经过两个步骤交替进行计算,第一步是计算期望(E),利用对隐藏变量的现有估计值,计算其最大似然估计值;第二步是最大化(M),最大化在E步上求得的最大似然值来计算参数的值。M步上找到的参数估计值被用于下一个E步计算中,这个过程不断交替进行。

最大期望值算法由Arthur P. Dempster(英语:Arthur P. Dempster),Nan Laird(英语:Nan Laird)和Donald Rubin(英语:Donald Rubin)在他们1977年发表的经典论文中提出。他们指出此方法之前其实已经被很多作者“在他们特定的研究领域中多次提出过”。

EM算法用于在方程不能直接求解的情况下寻找统计模型的(局部)最大似然参数。这些模型中较为典型的是含有潜变量,未知参数并且已知观测数据的模型。也就是说,要么数据中存在缺失的值,要么模型可以通过假设存在更多未观测到的数据点来更简单地表示。以混合模型(Mixture Model)为例,通过假设每个观察到的数据点都有一个对应的未观察到的数据点,也可以说是潜在变量,来指定每个数据点所属的混合部分,这样就可以更简单地描述混合模型。

EM是一个在已知部分相关变量的情况下,估计未知变量的迭代技术。EM的算法流程如下:

我们用 y {\displaystyle {\textbf {y}}} 表示能够观察到的不完整的变量值,用 x {\displaystyle {\textbf {x}}} 表示无法观察到的变量值,这样 x {\displaystyle {\textbf {x}}} y {\displaystyle {\textbf {y}}} 一起组成了完整的数据。 x {\displaystyle {\textbf {x}}} 可能是实际测量丢失的数据,也可能是能够简化问题的隐藏变量,如果它的值能够知道的话。例如,在混合模型中,如果“产生”样本的混合元素成分已知的话最大似然公式将变得更加便利(参见下面的例子)。

p {\displaystyle p\,} 代表矢量 θ {\displaystyle \theta } : p ( y , x | θ ) {\displaystyle p(\mathbf {y} ,\mathbf {x} |\theta )} 定义的参数的全部数据的几率密度函数(连续情况下)或者几率质量函数(离散情况下),那么从这个函数就可以得到全部数据的最大似然值,另外,在给定的观察到的数据条件下未知数据的条件分布可以表示为:

相关

  • 黑巫术黑巫术,又称黑魔法,即邪恶的巫术,最早是由日本电子游戏创造的术法概念。主要以伤害别人为目的,透过放蛊、咒诅、秘密仪式、书符等方式,达到谋杀、致病、迷惑、役使、嫁祸等目的,使
  • 藏缅语系藏缅语族是分布于中国西南部、印度东北部、尼泊尔、巴基斯坦、不丹、缅甸、泰国、越南等地的一组语言。根据民族语网站2009年的资料,藏缅语族共包含有435种语言,其中主要的语
  • 洋酒洋酒,指源自西洋(欧洲及北美洲地区),或是在这个地区制造的各种含酒精饮料。其中以葡萄酒、威士忌等最著名。这个名词盛行于中国、日本与韩国等东亚地区。在地理大发现之后,欧洲的
  • 艾哈迈德·乌叶海亚艾哈迈德·乌叶海亚(Ahmed Ouyahia,1952年7月2日-)(阿拉伯语:أحمد أويحيى),也翻译成乌叶海亚。阿尔及利亚政治家,曾经四次出任总理。生于蒂齐乌祖省。毕业于阿国立行政学院
  • 钼酸钠钼酸钠是钠的钼酸盐,化学式Na2MoO4,为白色菱形结晶体。通过钼精矿氧化焙烧生成三氧化钼,用液碱浸取生成钼酸钠溶液,后经抽滤、浓缩、冷却、离心、干燥后可制得。钼酸钠可溶于水,
  • 2,2,7,7-四甲基辛烷2,2,7,7-四甲基辛烷是一种有机化合物,化学式为C12H26,它是十二烷的同分异构体。它可由(Me3CC≡C)​2的加氢反应,或新己基溴的Wurtz反应(和钠反应)制得。叔丁基氯化镁和1,4-二溴丁
  • 福建省厦门第六中学坐标:24°50′20″N 118°09′53″E / 24.83889°N 118.16472°E / 24.83889; 118.16472高中部:厦门市和宁路50号 福建省厦门第六中学,简称厦门六中,是福建省的一所一级达标中学
  • 量子裁剪量子剪裁(或量子裁剪,英文:Quantum cutting)是指荧光材料每吸收一个大能量光子就会放出两个小能量光子的物理现象,其理论量子产率为200%。
  • 廷岑山坐标:46°36′41″N 9°40′16″E / 46.611472°N 9.671138°E / 46.611472; 9.671138廷岑山(Tinzenhorn),是瑞士的山峰,位于该国东部,由格劳宾登州负责管辖,属于阿尔布拉山脉的一
  • 奥山道郎奥山道郎(平假名:おくやま みちろう,1919年-1945年5月24日),是大日本帝国陆军军人,义烈空挺队队长,战死后被追授大佐军衔。他是三重県出身,千叶中学校毕业,陆军士官学校第53期。