概率图模型

✍ dations ◷ 2025-06-08 21:48:23 #统计学,概率图模型,机器学习,图论

在概率论、统计学及机器学习中,概率图模型(Graphical Model)是用图论方法以表现数个独立随机变量之关联的一种建模法。一个 p {\displaystyle p} 个节点的图中,节点 i {\displaystyle i} 对应一个随机变量,记为 X i {\displaystyle X_{i}} 。概率图模型被广泛地应用于贝叶斯统计与机器学习中。

在一个无向概率图模型(Undirected Graphical Model)中,两个节点 i {\displaystyle i} j {\displaystyle j} 之间没有边相连,当且仅当它们对应的随机变量 X i {\displaystyle X_{i}} X j {\displaystyle X_{j}} 给定其它所有节点上的随机变量条件下条件独立。数学表述为:

Θ i j = 0 X i X j | { X , = 1 , , p , i , j } {\displaystyle \Theta _{ij}=0\Leftrightarrow X_{i}\perp X_{j}|\{X_{\ell },\ell =1,\ldots ,p,\ell \neq i,\ell \neq j\}}

当所有的随机变量 X 1 , , X p {\displaystyle X_{1},\ldots ,X_{p}} 的联合分布是多元正态分布时, Θ {\displaystyle \Theta } 被理解为是多元正态分布的方差矩阵的逆 Θ = Σ 1 {\displaystyle \Theta =\Sigma ^{-1}} ,又称为精度矩阵(Precision Matrix)。现代统计学中,相当大比例的关于无向图模型的理论结果都是在多元正态分布的假设下取得的。

在一个有向概率图模型(Directed Graphical Model)中,两个节点 i {\displaystyle i} j {\displaystyle j} 之间的边际独立性和条件独立性比较复杂,一般需要用贝叶斯球规则(Bayes Ball)来确定。

一类很重要的有向概率图模型叫做有向无环概率图模型(Directed Acyclic Graphs, 简称DAG),可以证明,相互关系能用DAG表示的p个随机变量,其联合分布函数可以被分解为根节点的边际分布函数乘以由边决定的那些条件概率。数学表述为:

π ( X 1 , , X p ) = i I π ( X i ) × j J π ( X j | X Parent ( j ) ) {\displaystyle \pi (X_{1},\ldots ,X_{p})=\prod _{i\in {\cal {I}}}\pi (X_{i})\times \prod _{j\in {\cal {J}}}\pi (X_{j}|X_{{\textrm {Parent}}(j)})}

上式中, I {\displaystyle {\cal {I}}} 表示所有根节点的集合, J {\displaystyle {\cal {J}}} 表示所有其它节点的集合, Parent ( j ) {\displaystyle {\textrm {Parent}}(j)} 表示有向图中节点 j {\displaystyle j} 的所有父节点的集合。

一般概率图模型输入的数据是其节点上的随机变量 ( X 1 , , X p ) {\displaystyle (X_{1},\ldots ,X_{p})} 的独立重复观测值,可记为:

( X 1 ( k ) , , X p ( k ) ) , k = 1 , , n {\displaystyle (X_{1}^{(k)},\ldots ,X_{p}^{(k)}),k=1,\ldots ,n}

其中 n {\displaystyle n} 为样本量(Sample size)。一般来说,估计和统计推断的目标是在哪些节点间存在边,也就是从节点数据中恢复整个网络的样貌。现代统计学和生物统计学中,概率图模型多研究高维统计的情景,即样本量远小于随机变量数目: n p {\displaystyle n\ll p} 。一般的方法是假设图模型是一个高度稀疏的图,也就是只有几条很少的边,然后运用惩罚项或边际过滤等高维统计分析中的常用套路来获得稀疏的估计。这样的估计既可以是同时估计整个图中所有的边,也可以是对每一个节点估计其所连的边。理论研究多集中于各种惩罚项所估计出的图模型,其稀疏性质的正确性(这个概念叫做Sparsistency,注意它并不是相合性(Consistency))。

相关

  • 腰椎腰椎(英语:lumbar vertebrae)在腰部底下有5块,用以支持背部。Template:Bones of torso(英语:Template:Bones of torso) Template:Spinal nerves(英语:Template:Spinal nerves)
  • 超自然现象超自然(Supernatural)又称灵异现象,包含了超自然现象和超自然力量,即无科学根据而所谓在自然界的力量或现象。一旦超自然能够被证实,则它就不再是超自然了。超自然超出科学的范畴
  • 氯酸钠氯酸钠(化学式:NaClO3)是一种氧化剂,为白色晶体,可溶于水。加热熔融300℃以上分解,放出氧气,为强氧化剂;对热不稳定,易潮解;与磷、硫及有机物相混,遇热、摩擦或撞击,容易引起燃烧或爆炸,
  • 美丽人生 (意大利电影)《美丽人生》(意大利语:La vita è bella,意为“人生是美好的”),1997年电影,由导演罗伯托·贝尼尼自编自演,荣获奥斯卡最佳男主角、欧洲电影奖最佳影片及多个国际大奖。电影讲述意
  • 保罗·尼古列斯库-米齐尔保罗·尼古列斯库-米齐尔(罗马尼亚语:Paul Niculescu-Mizil;1923年11月25日-2008年12月5日),罗马尼亚共产党中央政治执行委员会委员,罗马尼亚部长会议副主席、教育部长、财政部长。
  • 奥古斯特·保罗·瓦瑟曼奥古斯特·保罗·冯·瓦瑟曼(英语:August Paul von Wassermann, 1866年2月21日-1925年3月16日)是一名德国的细菌学家、免疫学家。1866年2月21日生于德国班贝格,1925年3月16日卒于
  • 佟星佟星(1951年7月-)生于中华人民共和国辽宁省沈阳市,最高学历为广东师范学院政治历史系历史专业。
  • 鸡皮疙瘩丛书列表这是由R·L·斯坦撰写并由学乐集团出版的Goosebumps系列丛书。1992年7月出版了第一本书《死亡之家欢迎辞》。许多附带系列作品都是由Stine撰写的,其中包括2000年的《鸡皮疙瘩
  • 亚罗索 (科罗拉多州)亚罗索(英语:Jaroso)是位于美国科罗拉多州科斯蒂亚县的一个非建制地区。该地的面积和人口皆未知。亚罗索的座标为37°00′14″N 105°37′26″W / 37.00389°N 105.62389°W /
  • 东海龙王东海龙王,又称东海广德王、沧甯德王,别名显仁,《西游记》中称为敖广,《封神演义》中称为敖光。在五方龙王中叫青龙,同时是代表东方的神兽。唐天宝十年(751年),唐玄宗为四海龙王下诏