最大期望算法

✍ dations ◷ 2025-11-18 13:37:40 #估计理论,算法,机器学习算法

最大期望算法(Expectation-maximization algorithm,又译期望最大化算法)在统计中被用于寻找,依赖于不可观察的隐性变量的概率模型中,参数的最大似然估计。

在统计计算中,最大期望(EM)算法是在概率模型中寻找参数最大似然估计或者最大后验估计的算法,其中概率模型依赖于无法观测的隐变量。最大期望算法经常用在机器学习和计算机视觉的数据聚类(Data Clustering)领域。最大期望算法经过两个步骤交替进行计算,第一步是计算期望(E),利用对隐藏变量的现有估计值,计算其最大似然估计值;第二步是最大化(M),最大化在E步上求得的最大似然值来计算参数的值。M步上找到的参数估计值被用于下一个E步计算中,这个过程不断交替进行。

最大期望值算法由Arthur P. Dempster(英语:Arthur P. Dempster),Nan Laird(英语:Nan Laird)和Donald Rubin(英语:Donald Rubin)在他们1977年发表的经典论文中提出。他们指出此方法之前其实已经被很多作者“在他们特定的研究领域中多次提出过”。

EM算法用于在方程不能直接求解的情况下寻找统计模型的(局部)最大似然参数。这些模型中较为典型的是含有潜变量,未知参数并且已知观测数据的模型。也就是说,要么数据中存在缺失的值,要么模型可以通过假设存在更多未观测到的数据点来更简单地表示。以混合模型(Mixture Model)为例,通过假设每个观察到的数据点都有一个对应的未观察到的数据点,也可以说是潜在变量,来指定每个数据点所属的混合部分,这样就可以更简单地描述混合模型。

EM是一个在已知部分相关变量的情况下,估计未知变量的迭代技术。EM的算法流程如下:

我们用 y {\displaystyle {\textbf {y}}} 表示能够观察到的不完整的变量值,用 x {\displaystyle {\textbf {x}}} 表示无法观察到的变量值,这样 x {\displaystyle {\textbf {x}}} y {\displaystyle {\textbf {y}}} 一起组成了完整的数据。 x {\displaystyle {\textbf {x}}} 可能是实际测量丢失的数据,也可能是能够简化问题的隐藏变量,如果它的值能够知道的话。例如,在混合模型中,如果“产生”样本的混合元素成分已知的话最大似然公式将变得更加便利(参见下面的例子)。

p {\displaystyle p\,} 代表矢量 θ {\displaystyle \theta } : p ( y , x | θ ) {\displaystyle p(\mathbf {y} ,\mathbf {x} |\theta )} 定义的参数的全部数据的几率密度函数(连续情况下)或者几率质量函数(离散情况下),那么从这个函数就可以得到全部数据的最大似然值,另外,在给定的观察到的数据条件下未知数据的条件分布可以表示为:

相关

  • 侧生动物侧生动物是动物界里的一个古老的亚界,和其领鞭毛虫的祖先不同,它们有宏观的结构及分化的细胞,但又不像真后生动物一样有组织。现在唯一活着的侧生动物只有海绵,属于多孔动物门。
  • 型号型号,通常是指商业产品,同系列的子产品,为了区隔出厂顺序,而给予不同的型号。型号设定通常是以英文字母开头,阿拉伯数字而后,例如富士数码相机有j100、j150等。除了商业产品外,有些
  • 沃达丰沃达丰集团(Vodafone Group plc,/ˈvoʊdəfoʊn/)又音译为伏得风或伏特风,是英国一家跨国电信公司,其总部位于英国伦敦。沃达丰为世界上第二大移动通讯网络公司,截至2019年9月30
  • 梣树参见本文。梣树(学名:Fraxinus)是木犀科梣属落叶乔木的通称,约有60个物种。产于温带和亚热带地区,在中国有近30种,北方、南方和中部都有种植。其学名来自于拉丁语的“矛”,因为当时
  • 波兰流亡政府中世纪早期(英语:Poland in the Early Middle Ages) · 波兰的基督教化 · 第一王国 · 第二王国 · 皮尔斯特王朝 · 雅盖隆王朝第一共和国 / 波兰立陶宛联邦 · 俄普奥三次
  • 东钱湖东钱湖,亦称东湖、万金湖,是中国浙江省宁波市境内的一个湖泊。东钱湖位于鄞州区东钱湖镇境内,南北长8.5公里,东西宽4.5公里,水域面积19.14平方公里,是浙江省最大的天然湖泊,也是宁
  • TCP拥塞控制TCP拥塞控制是传输控制协议(英语:Transmission Control Protocol,缩写TCP)避免网络拥塞的算法,是互联网上主要的一个拥塞控制措施。它使用一套基于线增积减模式(英语:additive incr
  • 中山国中山国,姬姓,春秋战国时白狄的一支——鲜虞仿照东周各诸侯国于公元前507年建立的国家,位于今河北省中部太行山东麓一带,中山国当时位于赵国和燕国之间,都于顾,后迁都于灵寿(今中国
  • R·C·布福德罗伯特·坎特伯里·布福德(英语:Robert Canterbury Buford,1960年10月-),通称R·C·布福德(R. C. Buford),现任美国NBA联盟圣安东尼奥马刺执行长一职。他在2002年被任命为马刺总经理,
  • 李学诗 (安阳)李学诗(1535年-?年),字子兴,河南彰德府安阳县人,民籍,治《诗经》,年三十一岁中式嘉靖四十四年乙丑科第三甲第一百五十七名进士。三月二十三日生,行一,曾祖李俊;祖李宪;父李廷臣;前母杜氏;乔