混合模型

✍ dations ◷ 2025-10-21 10:30:44 #混合模型

在统计学中,混合模型(Mixture model)是用于表示母体中子母体的存在的几率模型,换句话说,混合模型表示了测量结果在母体中的几率分布,它是一个由数个子母体之几率分布组成的混合分布。混合模型不要求测量结果供关于各个子母体之几率分布的资讯即可计算测量结果在母体分布中的几率。

对一维的随机变数 X {displaystyle X} 的高斯分布存在以下几率密度函数:

F X ( x ) = P X ( X x ) = 1 σ 2 π exp ( ( x μ ) 2 2 σ 2 ) {displaystyle F_{X}(x)=P_{X}(Xleq x)={frac {1}{sigma {sqrt {2pi }}}}exp {(-{frac {(x-mu )^{2}}{2sigma ^{2}}})}}

其中的 σ {displaystyle sigma } X {displaystyle X} 的标准差, μ {displaystyle mu } X {displaystyle X} 的期望值。

而当将高斯分布推广到 k {displaystyle k} 维时,根据定义,若 k {displaystyle k} 维的随机向量 X = T {displaystyle X=^{T}} 服从多变数的正态分布,则存在一个对称半正定的共变异数矩阵 Σ {displaystyle Sigma } 以及期望值向量 μ = T {displaystyle mu =^{T}} 满足 X {displaystyle X} 的特征函数。若 Σ {displaystyle Sigma } 为非奇异的,则此分布可以由以下的几率密度函数描述:

f x ( x 1 , , x k ) = 1 ( 2 π ) k | Σ | e 1 2 ( x μ ) T Σ 1 ( x μ ) , {displaystyle {displaystyle f_{mathbf {x} }(x_{1},ldots ,x_{k})={frac {1}{sqrt {(2pi )^{k}|{boldsymbol {Sigma }}|}}}mathrm {e} ^{-{frac {1}{2}}({mathbf {x} }-{boldsymbol {mu }})^{mathrm {T} }{boldsymbol {Sigma }}^{-1}({mathbf {x} }-{boldsymbol {mu }})},}} | Σ | {displaystyle |Sigma |} 为共变异数矩阵的行列式。

而高斯混合模型为单一高斯概率密度函数的延伸,用多个高斯概率密度函数(正态分布曲线)精确地量化变量分布,是将变量分布分解为若干基于高斯概率密度函数(正态分布曲线)分布的统计子模型,每个子模型可视为此混合模型的隐变量。

举一个不是那么严谨的例子,若是我们手上有一个班级中所有学生某一次考试的各项科目分数分布,并且每一科的分数都大致依照高斯分布。则当我们要描述每个学生的总分分布时,单高斯模型及多维的高斯模型不一定能很好的描述这个分布,因为每一科的分布的情形都不尽相同,此时我们可以用高斯混合分布更好的来描述这个问题。

相关

  • 腰斩腰斩,是极残酷的死刑执行方式之一,从罪犯腰部将罪犯切成两段(或两段以上)的刑罚,其目的是延长罪犯死亡的时间,增加其痛苦(因人体主要器官位于上半身,故腰斩后至死亡尚有一段时间)。一
  • 俄罗斯平原东欧平原位于欧洲东部,范围北起北冰洋,南至黑海、里海之滨;东起乌拉尔山,西至波罗的海,面积近400万平方公里,平均海拔170米。东欧平原大部分在俄罗斯境内,因此又称为俄罗斯平原、欧
  • 芭堤雅芭堤雅(泰语:พัทยา;英语:Phattaya或Pattaya)一译帕塔亚,是一个泰国东部地大区春武里府的城市,是春武里府的“府级特别市”,在行政大区划上属于邦拉蒙县。泰国华侨传统上称为北
  • 巩志巩志,《三国演义》虚构人物,在武陵太守金旋手下担任从事,后来刘备派张飞攻打武陵时,劝金旋降刘但不被接受,金旋败给张飞之后,便一箭射杀金旋投与百姓一起归顺刘备,后刘备任命其为武
  • 摇滚本事电影原声带摇滚本事电影原声带是台湾乐团五月天的纪录电影《摇滚本事》之电影原声音乐专辑,由滚石唱片发行,内含1CD共收录4首歌,2002年12月1日于台湾发行。
  • 红色系列《红色系列》(日语:ドラマ・赤いシリーズ)是日本TBS电视台和大映电视台于1974年、1975年、1976年、1977年、1978年、1979年、1980年、2006年制作的11部悬疑连续剧的总称,刻画和
  • 曼哈顿距离计程车几何(Taxicab geometry)或曼哈顿距离(Manhattan distance or Manhattan length)或方格线距离是由十九世纪的赫尔曼·闵可夫斯基所创辞汇,为欧几里得几何度量空间的几何
  • 8lak8lak,本名张钧(2002年5月24日-),台湾歌手。从国中开始听饶舌歌曲,2020年6月5日发布个人首张单曲《Lover boy》,2021年夏天开始参加嘻哈类选秀节目,从此不断活跃于音乐圈发布许多作品,更与2000组成团体《》。出生于台北,国中就读康桥国际学校,后转到金华国中,毕业于大安高工,目前就读台北科技大学工程管理系。
  • 米奇·巴舒亚伊米奇·巴舒亚伊·通加(英语:Michy Batshuayi Tunga,1993年10月2日-),是一名刚果民主共和国裔比利时足球运动员,司职前锋,曾效力标准列日与马赛,现效力于土超球队费内巴切。比利时国家足球队成员。自2015年起,巴舒亚伊召入比利时成人国家队,并入选2016年欧洲足球锦标赛及2018年世界杯比利时23人名单内。巴舒亚伊出生于比利时首都布鲁塞尔。青年队时期,巴舒亚伊曾待在埃韦勒(荷兰语:RFC Evere)、斯哈尔贝克(荷兰语:Crossing Schaerbeek (4070))、布鲁
  • 塞尔吉·奥里耶塞尔吉·奥里耶(英语:Serge Aurier;1992年12月24日-),是一位科特迪瓦足球运动员。现效力于英超球队诺丁汉森林。他也是科特迪瓦国家足球队队长。司职右后卫。奥里耶体能充沛且身体强壮,解围和助攻能力也很不错。