概率图模型

✍ dations ◷ 2025-09-14 06:11:18 #统计学,概率图模型,机器学习,图论

在概率论、统计学及机器学习中,概率图模型(Graphical Model)是用图论方法以表现数个独立随机变量之关联的一种建模法。一个 p {\displaystyle p} 个节点的图中,节点 i {\displaystyle i} 对应一个随机变量,记为 X i {\displaystyle X_{i}} 。概率图模型被广泛地应用于贝叶斯统计与机器学习中。

在一个无向概率图模型(Undirected Graphical Model)中,两个节点 i {\displaystyle i} j {\displaystyle j} 之间没有边相连,当且仅当它们对应的随机变量 X i {\displaystyle X_{i}} X j {\displaystyle X_{j}} 给定其它所有节点上的随机变量条件下条件独立。数学表述为:

Θ i j = 0 X i X j | { X , = 1 , , p , i , j } {\displaystyle \Theta _{ij}=0\Leftrightarrow X_{i}\perp X_{j}|\{X_{\ell },\ell =1,\ldots ,p,\ell \neq i,\ell \neq j\}}

当所有的随机变量 X 1 , , X p {\displaystyle X_{1},\ldots ,X_{p}} 的联合分布是多元正态分布时, Θ {\displaystyle \Theta } 被理解为是多元正态分布的方差矩阵的逆 Θ = Σ 1 {\displaystyle \Theta =\Sigma ^{-1}} ,又称为精度矩阵(Precision Matrix)。现代统计学中,相当大比例的关于无向图模型的理论结果都是在多元正态分布的假设下取得的。

在一个有向概率图模型(Directed Graphical Model)中,两个节点 i {\displaystyle i} j {\displaystyle j} 之间的边际独立性和条件独立性比较复杂,一般需要用贝叶斯球规则(Bayes Ball)来确定。

一类很重要的有向概率图模型叫做有向无环概率图模型(Directed Acyclic Graphs, 简称DAG),可以证明,相互关系能用DAG表示的p个随机变量,其联合分布函数可以被分解为根节点的边际分布函数乘以由边决定的那些条件概率。数学表述为:

π ( X 1 , , X p ) = i I π ( X i ) × j J π ( X j | X Parent ( j ) ) {\displaystyle \pi (X_{1},\ldots ,X_{p})=\prod _{i\in {\cal {I}}}\pi (X_{i})\times \prod _{j\in {\cal {J}}}\pi (X_{j}|X_{{\textrm {Parent}}(j)})}

上式中, I {\displaystyle {\cal {I}}} 表示所有根节点的集合, J {\displaystyle {\cal {J}}} 表示所有其它节点的集合, Parent ( j ) {\displaystyle {\textrm {Parent}}(j)} 表示有向图中节点 j {\displaystyle j} 的所有父节点的集合。

一般概率图模型输入的数据是其节点上的随机变量 ( X 1 , , X p ) {\displaystyle (X_{1},\ldots ,X_{p})} 的独立重复观测值,可记为:

( X 1 ( k ) , , X p ( k ) ) , k = 1 , , n {\displaystyle (X_{1}^{(k)},\ldots ,X_{p}^{(k)}),k=1,\ldots ,n}

其中 n {\displaystyle n} 为样本量(Sample size)。一般来说,估计和统计推断的目标是在哪些节点间存在边,也就是从节点数据中恢复整个网络的样貌。现代统计学和生物统计学中,概率图模型多研究高维统计的情景,即样本量远小于随机变量数目: n p {\displaystyle n\ll p} 。一般的方法是假设图模型是一个高度稀疏的图,也就是只有几条很少的边,然后运用惩罚项或边际过滤等高维统计分析中的常用套路来获得稀疏的估计。这样的估计既可以是同时估计整个图中所有的边,也可以是对每一个节点估计其所连的边。理论研究多集中于各种惩罚项所估计出的图模型,其稀疏性质的正确性(这个概念叫做Sparsistency,注意它并不是相合性(Consistency))。

相关

  • 国家突发公共事件应急响应机制国家突发公共事件应急响应机制,是根据中华人民共和国国务院制订的《国家突发公共事件总体应急预案》所采取的全国性应急预案体系,其目的是提高政府保障公共安全和处置突发公共
  • span class=nowrapCrOsub2/sub(NOsub3/sub)sub&硝酸铬酰是一种无机化合物,化学式为CrO2(NO3)2。它最初于1954年由Schmiesser和Lutzow制备出来。硝酸铬酰可以由硝酸钠和氟化铬酰(CrO2F2)反应得到:硝酸铬酰受热分解,生成三氧化铬
  • 佯僙语佯僙语是毛南族佯僙人所使用的本民族语言。佯僙人分布于中华人民共和国贵州省黔南布依族苗族自治州惠水县和平塘县与独山县接壤的山间河谷地区。1990年的数据显示,中国境内有
  • Kolokol-1Kolokol-1(俄语:Колокол,意为“钟”)是一种合成鸦片类药物,用作气溶胶失能剂。其具体的化学成分尚未被俄罗斯政府所披露。它在莫斯科歌剧院胁持事件中被使用,造成700余名人
  • 露德温·塞尼耶露德温·塞尼耶(Ludivine Sagnier,1979年7月3日-),是法国女演员,模特,自1989年以来她曾经参演33部电影。她两次被提名为凯撒电影奖提名最佳女配角,分别是2003年的《游泳池》和2007年
  • 明朝皇子命名仪明朝皇子命名仪是明朝一套为皇子取名的礼仪制度。命名仪,最早可以追溯到周代《礼记》中的记载,明太祖初年就已经有一定仪式,但至明世宗嘉靖十二年(1533年)才特别确定了这套制度,明
  • 国民革命军第53军国民革命军第53军是1933年至1948年存在的一直东北系中央化的军级部队。1933年2月,东北军整编,组建第53军。西安事变后1937年5月中旬东北局整编,撤销第119、第129师,辖:七七事变后
  • 提亚·田中提亚·田中(Tia Tanaka,1987年3月15日-)是美国的专业的色情片女演员,她父亲是越南人,母亲则是法越混血儿。 Tia Tanaka出生于印尼,一岁时就随着父母移民到美国。首先居住在纽约,随后
  • 杰夫·宾格曼杰夫·宾格曼(Jeff Bingaman;1943年10月3日-)是美国的一位政治人物。在1983年至2013年期间,他是新墨西哥州的两位参议院议员之一。他的党籍是民主党。2011年,宾格曼宣布他不会在20
  • 佛罗里达州州徽佛罗里达州州徽用于代表佛罗里达州政府,同时用于各种正式目的,例如加盖正式文件和法案。它通常用于州政府的建筑物、车辆和其他设施。它也出现在佛罗里达州的州旗上。佛罗里达