概率图模型

✍ dations ◷ 2025-11-06 10:16:23 #统计学,概率图模型,机器学习,图论

在概率论、统计学及机器学习中,概率图模型(Graphical Model)是用图论方法以表现数个独立随机变量之关联的一种建模法。一个 p {\displaystyle p} 个节点的图中,节点 i {\displaystyle i} 对应一个随机变量,记为 X i {\displaystyle X_{i}} 。概率图模型被广泛地应用于贝叶斯统计与机器学习中。

在一个无向概率图模型(Undirected Graphical Model)中,两个节点 i {\displaystyle i} j {\displaystyle j} 之间没有边相连,当且仅当它们对应的随机变量 X i {\displaystyle X_{i}} X j {\displaystyle X_{j}} 给定其它所有节点上的随机变量条件下条件独立。数学表述为:

Θ i j = 0 X i X j | { X , = 1 , , p , i , j } {\displaystyle \Theta _{ij}=0\Leftrightarrow X_{i}\perp X_{j}|\{X_{\ell },\ell =1,\ldots ,p,\ell \neq i,\ell \neq j\}}

当所有的随机变量 X 1 , , X p {\displaystyle X_{1},\ldots ,X_{p}} 的联合分布是多元正态分布时, Θ {\displaystyle \Theta } 被理解为是多元正态分布的方差矩阵的逆 Θ = Σ 1 {\displaystyle \Theta =\Sigma ^{-1}} ,又称为精度矩阵(Precision Matrix)。现代统计学中,相当大比例的关于无向图模型的理论结果都是在多元正态分布的假设下取得的。

在一个有向概率图模型(Directed Graphical Model)中,两个节点 i {\displaystyle i} j {\displaystyle j} 之间的边际独立性和条件独立性比较复杂,一般需要用贝叶斯球规则(Bayes Ball)来确定。

一类很重要的有向概率图模型叫做有向无环概率图模型(Directed Acyclic Graphs, 简称DAG),可以证明,相互关系能用DAG表示的p个随机变量,其联合分布函数可以被分解为根节点的边际分布函数乘以由边决定的那些条件概率。数学表述为:

π ( X 1 , , X p ) = i I π ( X i ) × j J π ( X j | X Parent ( j ) ) {\displaystyle \pi (X_{1},\ldots ,X_{p})=\prod _{i\in {\cal {I}}}\pi (X_{i})\times \prod _{j\in {\cal {J}}}\pi (X_{j}|X_{{\textrm {Parent}}(j)})}

上式中, I {\displaystyle {\cal {I}}} 表示所有根节点的集合, J {\displaystyle {\cal {J}}} 表示所有其它节点的集合, Parent ( j ) {\displaystyle {\textrm {Parent}}(j)} 表示有向图中节点 j {\displaystyle j} 的所有父节点的集合。

一般概率图模型输入的数据是其节点上的随机变量 ( X 1 , , X p ) {\displaystyle (X_{1},\ldots ,X_{p})} 的独立重复观测值,可记为:

( X 1 ( k ) , , X p ( k ) ) , k = 1 , , n {\displaystyle (X_{1}^{(k)},\ldots ,X_{p}^{(k)}),k=1,\ldots ,n}

其中 n {\displaystyle n} 为样本量(Sample size)。一般来说,估计和统计推断的目标是在哪些节点间存在边,也就是从节点数据中恢复整个网络的样貌。现代统计学和生物统计学中,概率图模型多研究高维统计的情景,即样本量远小于随机变量数目: n p {\displaystyle n\ll p} 。一般的方法是假设图模型是一个高度稀疏的图,也就是只有几条很少的边,然后运用惩罚项或边际过滤等高维统计分析中的常用套路来获得稀疏的估计。这样的估计既可以是同时估计整个图中所有的边,也可以是对每一个节点估计其所连的边。理论研究多集中于各种惩罚项所估计出的图模型,其稀疏性质的正确性(这个概念叫做Sparsistency,注意它并不是相合性(Consistency))。

相关

  • 诈死装死(apparent death、playing dead、feigning death、playing possum、tonic immobility、thanatosis),也作假死、拟死,是动物把自己伪装成死亡状态的一种行为。这种动物的欺骗
  • 阴道口阴道口(vaginal orifice)是阴道开口的缝隙,位在二片小阴唇之间,尿道开口的下方,其大小和处女膜的面积有关,处女膜盖住的面积越大,阴道口则越小。阴道的伸展度常随着年龄的不同而有
  • 金融学院南开大学金融学院,成立于2015年6月15日,其历史可以追溯至1923年成立的南开大学经济学科。1958年,南开大学经济管理类学科被抽调组建河北财经学院(今天津财经大学)。改革开放后,南
  • 新西班牙新西班牙总督辖区(西班牙语:Virreinato de Nueva España IPA:.mw-parser-output .IPA{font-family:"Charis SIL","Doulos SIL","Linux Libertine","Segoe UI","Lucida Sans Un
  • 鼓楼区鼓楼区是中华人民共和国河南省开封市的一个市辖区。面积59平方公里,2005年人口16万。目前下辖:卧龙街道、新华街道、西司门街道、城西街道、相国寺街道、州桥街道和仙人庄街道
  • 鲁斯丹·埃芬迪鲁斯丹·埃芬迪(印尼语:Roestam Effendi,精确拼音:Rustam Effendi,1903年5月13日-1979年5月24日),印度尼西亚作家,印尼第一部现代舞台剧《贝巴沙丽》和诗集《沉思集》的作者,后于1928
  • 布鲁斯 (维松)布鲁斯(英语:Sextus Afranius Burrus,1年-62年)。古罗马将领。出生于维松的一个骑士家庭。曾经担任近卫军长官,他与塞涅卡同为尼禄的谋臣,并帮助其削弱了小阿格里皮娜的政治权力。
  • 东门城之内东门城之内是一间于2015年9月启用的艺术替代空间。该空间设立于台湾新竹市的东门市场内(1085号摊位),由当时国立新竹教育大学艺术与设计学系(现为国立清华大学艺术与设计学系)6
  • 佐山哲郎佐山哲郎(1948年-)为日本东京都出身的漫画剧情作家、俳句家。青年时期就读东京都立大学的人文学系,在未就学完毕退学后开始担任多家杂志社的编辑、以及漫画剧本的编写作家。1980
  • 碲化二(二甲基铝)碲化二(二甲基铝)是一种化合物,化学式为2Te。它可由碲化二(三丁基锡)和三甲基铝在甲苯中于90 °C反应得到。它可用于将C=O转化为C=Te,以制备碲醛、碲酮、碲代酰胺、异碲氰酸酯