最大期望算法

✍ dations ◷ 2025-03-07 10:45:54 #估计理论,算法,机器学习算法

最大期望算法(Expectation-maximization algorithm,又译期望最大化算法)在统计中被用于寻找,依赖于不可观察的隐性变量的概率模型中,参数的最大似然估计。

在统计计算中,最大期望(EM)算法是在概率模型中寻找参数最大似然估计或者最大后验估计的算法,其中概率模型依赖于无法观测的隐变量。最大期望算法经常用在机器学习和计算机视觉的数据聚类(Data Clustering)领域。最大期望算法经过两个步骤交替进行计算,第一步是计算期望(E),利用对隐藏变量的现有估计值,计算其最大似然估计值;第二步是最大化(M),最大化在E步上求得的最大似然值来计算参数的值。M步上找到的参数估计值被用于下一个E步计算中,这个过程不断交替进行。

最大期望值算法由Arthur P. Dempster(英语:Arthur P. Dempster),Nan Laird(英语:Nan Laird)和Donald Rubin(英语:Donald Rubin)在他们1977年发表的经典论文中提出。他们指出此方法之前其实已经被很多作者“在他们特定的研究领域中多次提出过”。

EM算法用于在方程不能直接求解的情况下寻找统计模型的(局部)最大似然参数。这些模型中较为典型的是含有潜变量,未知参数并且已知观测数据的模型。也就是说,要么数据中存在缺失的值,要么模型可以通过假设存在更多未观测到的数据点来更简单地表示。以混合模型(Mixture Model)为例,通过假设每个观察到的数据点都有一个对应的未观察到的数据点,也可以说是潜在变量,来指定每个数据点所属的混合部分,这样就可以更简单地描述混合模型。

EM是一个在已知部分相关变量的情况下,估计未知变量的迭代技术。EM的算法流程如下:

我们用 y {\displaystyle {\textbf {y}}} 表示能够观察到的不完整的变量值,用 x {\displaystyle {\textbf {x}}} 表示无法观察到的变量值,这样 x {\displaystyle {\textbf {x}}} y {\displaystyle {\textbf {y}}} 一起组成了完整的数据。 x {\displaystyle {\textbf {x}}} 可能是实际测量丢失的数据,也可能是能够简化问题的隐藏变量,如果它的值能够知道的话。例如,在混合模型中,如果“产生”样本的混合元素成分已知的话最大似然公式将变得更加便利(参见下面的例子)。

p {\displaystyle p\,} 代表矢量 θ {\displaystyle \theta } : p ( y , x | θ ) {\displaystyle p(\mathbf {y} ,\mathbf {x} |\theta )} 定义的参数的全部数据的几率密度函数(连续情况下)或者几率质量函数(离散情况下),那么从这个函数就可以得到全部数据的最大似然值,另外,在给定的观察到的数据条件下未知数据的条件分布可以表示为:

相关

  • 教育可视化可视化是指用于创建图形、图像或动画,以便交流沟通讯息的任何技术和方法。在历史上包括洞穴壁画、埃及象形文字等,如今可视化有不断扩大的应用领域,如科学教育、工程、互动多媒
  • 国立台湾史前文化博物馆国立台湾史前文化博物馆(简称史前馆)位于台湾台东县台东市,是台湾主要的公立人类学与自然史博物馆之一,也是台湾东部唯一的国家级博物馆,以台湾史前文化和台湾原住民族文化的文物
  • 三倍体同源多倍体是由某个细胞在分裂过程中姐妹染色单体或同源染色体分离失败使染色体数目加倍造成的多倍体。由于同源多倍体个体每个细胞中染色体组数可能为奇数,使它们在减数分裂
  • 周唯中周唯中(英语:Matthew W. Chou),中华民国外交官。毕业于国立政治大学政治学系学士、公共行政所硕士,曾任驻南非大使馆二等秘书、外交部领事事务局科长、驻堪萨斯台北经济文化办事
  • 先军思想朝鲜民主主义人民共和国主题先军政治(韩语:선군정치),也译作先军思想,是朝鲜民主主义人民共和国与主体思想并行的主要政治理论和指导方针。这是一个综合性的政策,其内容简单的说,就
  • 斑点狮斑点狮(英语:Marozi、学名:)是狮子的一个亚种,体型较一般狮子细,不同于一般狮子居住在草原,班点狮适合居住在山区,已经绝迹于世上。非洲土人很早以前就熟悉斑点狮,欧洲人则在1904年
  • 铯钟铯钟,又叫原子铯钟,是一种使用铯的精密的计时仪器。其发明者是美国人N·F·拉姆齐(Norman Foster Ramsey),他也因发明原子铯钟以及提出氢微波激射技术获得了1989年的诺贝尔物理学
  • 春日局春日局(1579年-1643年10月26日),本名斋藤福,父亲是明智光秀的家臣斋藤利三,母亲是稻叶一铁(良通)之女。后来成为江户幕府三代将军德川家光的乳母,奉命前往皇宫觐见后水尾天皇,得到天皇
  • 哈扎拉吉语哈扎拉吉语(波斯语:هزارگی یا آزرگی‎)属于印欧语系印度-伊朗语族,是一种在阿富汗、伊朗、巴基斯坦和塔吉克斯坦等国家由蒙古人血统的哈扎拉族使用的语言 。哈扎拉
  • 壮族哭嫁歌壮族哭嫁歌也叫“伴离歌”、“伴嫁歌”、“送嫁歌”、“送老”(取义“送姑娘去与丈夫百年偕老”)是一种壮族礼俗歌曲,在广西南宁、钦州和百色等地区流传。婚礼前一夜,新娘穿新衣