概率图模型

✍ dations ◷ 2025-07-06 02:36:05 #统计学,概率图模型,机器学习,图论

在概率论、统计学及机器学习中,概率图模型(Graphical Model)是用图论方法以表现数个独立随机变量之关联的一种建模法。一个 p {\displaystyle p} 个节点的图中,节点 i {\displaystyle i} 对应一个随机变量,记为 X i {\displaystyle X_{i}} 。概率图模型被广泛地应用于贝叶斯统计与机器学习中。

在一个无向概率图模型(Undirected Graphical Model)中,两个节点 i {\displaystyle i} j {\displaystyle j} 之间没有边相连,当且仅当它们对应的随机变量 X i {\displaystyle X_{i}} X j {\displaystyle X_{j}} 给定其它所有节点上的随机变量条件下条件独立。数学表述为:

Θ i j = 0 X i X j | { X , = 1 , , p , i , j } {\displaystyle \Theta _{ij}=0\Leftrightarrow X_{i}\perp X_{j}|\{X_{\ell },\ell =1,\ldots ,p,\ell \neq i,\ell \neq j\}}

当所有的随机变量 X 1 , , X p {\displaystyle X_{1},\ldots ,X_{p}} 的联合分布是多元正态分布时, Θ {\displaystyle \Theta } 被理解为是多元正态分布的方差矩阵的逆 Θ = Σ 1 {\displaystyle \Theta =\Sigma ^{-1}} ,又称为精度矩阵(Precision Matrix)。现代统计学中,相当大比例的关于无向图模型的理论结果都是在多元正态分布的假设下取得的。

在一个有向概率图模型(Directed Graphical Model)中,两个节点 i {\displaystyle i} j {\displaystyle j} 之间的边际独立性和条件独立性比较复杂,一般需要用贝叶斯球规则(Bayes Ball)来确定。

一类很重要的有向概率图模型叫做有向无环概率图模型(Directed Acyclic Graphs, 简称DAG),可以证明,相互关系能用DAG表示的p个随机变量,其联合分布函数可以被分解为根节点的边际分布函数乘以由边决定的那些条件概率。数学表述为:

π ( X 1 , , X p ) = i I π ( X i ) × j J π ( X j | X Parent ( j ) ) {\displaystyle \pi (X_{1},\ldots ,X_{p})=\prod _{i\in {\cal {I}}}\pi (X_{i})\times \prod _{j\in {\cal {J}}}\pi (X_{j}|X_{{\textrm {Parent}}(j)})}

上式中, I {\displaystyle {\cal {I}}} 表示所有根节点的集合, J {\displaystyle {\cal {J}}} 表示所有其它节点的集合, Parent ( j ) {\displaystyle {\textrm {Parent}}(j)} 表示有向图中节点 j {\displaystyle j} 的所有父节点的集合。

一般概率图模型输入的数据是其节点上的随机变量 ( X 1 , , X p ) {\displaystyle (X_{1},\ldots ,X_{p})} 的独立重复观测值,可记为:

( X 1 ( k ) , , X p ( k ) ) , k = 1 , , n {\displaystyle (X_{1}^{(k)},\ldots ,X_{p}^{(k)}),k=1,\ldots ,n}

其中 n {\displaystyle n} 为样本量(Sample size)。一般来说,估计和统计推断的目标是在哪些节点间存在边,也就是从节点数据中恢复整个网络的样貌。现代统计学和生物统计学中,概率图模型多研究高维统计的情景,即样本量远小于随机变量数目: n p {\displaystyle n\ll p} 。一般的方法是假设图模型是一个高度稀疏的图,也就是只有几条很少的边,然后运用惩罚项或边际过滤等高维统计分析中的常用套路来获得稀疏的估计。这样的估计既可以是同时估计整个图中所有的边,也可以是对每一个节点估计其所连的边。理论研究多集中于各种惩罚项所估计出的图模型,其稀疏性质的正确性(这个概念叫做Sparsistency,注意它并不是相合性(Consistency))。

相关

  • 曼彻斯特运河曼彻斯特运河(Manchester Ship Canal)是位于英国西北英格兰曼彻斯特的一个运河系统,连通曼彻斯特和爱尔兰海。曼彻斯特运河全长58公里,起点是梅西河。曼彻斯特运河的历史可以追
  • 普苏森尼斯一世普苏森尼斯一世是于公元前1047至前1001年统治塔尼斯的古埃及二十一王朝第三位法老。普苏森尼斯这个名字是希腊翻译,原文名字是帕斯普卡努或霍尔-帕塞巴克亨纽特,意为“出现在
  • 饮品饮料,也称饮品,是指经过加工供予饮用的液体,分为软性饮料和酒。
  • 瓦德瓦德(阿拉伯语:الواد‎)位于阿尔及利亚东北部,是瓦德省的首府。
  • 自由塔自由塔可以指:
  • 台湾蛮野心足生态协会社团法人台湾蛮野心足生态协会(英语:Wild at heart Legal Defense Association, Taiwan),简称蛮野,是台湾一个环境法律团体,于2003年成立。台湾蛮野心足生态协会是由原籍美国的律
  • 高达前哨战 《高达前哨战》(ガンダム・センチネル、GUNDAM SENTINEL),是一部以情境模型为插图的高达系列小说作品。于1989年在大日本绘画出版社所发行的月刊模型杂志
  • 凯雷顿 (阿拉巴马州)凯雷顿(英文:Kellyton),是美国阿拉巴马州下属的一座城市。面积约为0.96平方英里(约合 2.5平方公里)。根据2010年美国人口普查,该市有人口217人,人口密度为225.1/平方英里(约合86.8/平
  • 明明 (大熊猫)明明是一只雌性大熊猫,1977年出生于四川平武野外,2011年5月去世,以34岁的年龄成为当时历史上寿命最长的大熊猫。明明于1979年在野外被抢救。1986年被借往爱尔兰都柏林动物园,199
  • 国立劳动大学国立劳动大学的前身即为上海大学。成立于1927年4月;后于1932年一二八事变校舍被毁后,于同年6月7日明令停办撤校。位于上海闸北青岛路青云坊的该校,不但是国民政府于上海的第一