概率图模型

✍ dations ◷ 2024-12-22 09:05:24 #统计学,概率图模型,机器学习,图论

在概率论、统计学及机器学习中,概率图模型(Graphical Model)是用图论方法以表现数个独立随机变量之关联的一种建模法。一个 p {\displaystyle p} 个节点的图中,节点 i {\displaystyle i} 对应一个随机变量,记为 X i {\displaystyle X_{i}} 。概率图模型被广泛地应用于贝叶斯统计与机器学习中。

在一个无向概率图模型(Undirected Graphical Model)中,两个节点 i {\displaystyle i} j {\displaystyle j} 之间没有边相连,当且仅当它们对应的随机变量 X i {\displaystyle X_{i}} X j {\displaystyle X_{j}} 给定其它所有节点上的随机变量条件下条件独立。数学表述为:

Θ i j = 0 X i X j | { X , = 1 , , p , i , j } {\displaystyle \Theta _{ij}=0\Leftrightarrow X_{i}\perp X_{j}|\{X_{\ell },\ell =1,\ldots ,p,\ell \neq i,\ell \neq j\}}

当所有的随机变量 X 1 , , X p {\displaystyle X_{1},\ldots ,X_{p}} 的联合分布是多元正态分布时, Θ {\displaystyle \Theta } 被理解为是多元正态分布的方差矩阵的逆 Θ = Σ 1 {\displaystyle \Theta =\Sigma ^{-1}} ,又称为精度矩阵(Precision Matrix)。现代统计学中,相当大比例的关于无向图模型的理论结果都是在多元正态分布的假设下取得的。

在一个有向概率图模型(Directed Graphical Model)中,两个节点 i {\displaystyle i} j {\displaystyle j} 之间的边际独立性和条件独立性比较复杂,一般需要用贝叶斯球规则(Bayes Ball)来确定。

一类很重要的有向概率图模型叫做有向无环概率图模型(Directed Acyclic Graphs, 简称DAG),可以证明,相互关系能用DAG表示的p个随机变量,其联合分布函数可以被分解为根节点的边际分布函数乘以由边决定的那些条件概率。数学表述为:

π ( X 1 , , X p ) = i I π ( X i ) × j J π ( X j | X Parent ( j ) ) {\displaystyle \pi (X_{1},\ldots ,X_{p})=\prod _{i\in {\cal {I}}}\pi (X_{i})\times \prod _{j\in {\cal {J}}}\pi (X_{j}|X_{{\textrm {Parent}}(j)})}

上式中, I {\displaystyle {\cal {I}}} 表示所有根节点的集合, J {\displaystyle {\cal {J}}} 表示所有其它节点的集合, Parent ( j ) {\displaystyle {\textrm {Parent}}(j)} 表示有向图中节点 j {\displaystyle j} 的所有父节点的集合。

一般概率图模型输入的数据是其节点上的随机变量 ( X 1 , , X p ) {\displaystyle (X_{1},\ldots ,X_{p})} 的独立重复观测值,可记为:

( X 1 ( k ) , , X p ( k ) ) , k = 1 , , n {\displaystyle (X_{1}^{(k)},\ldots ,X_{p}^{(k)}),k=1,\ldots ,n}

其中 n {\displaystyle n} 为样本量(Sample size)。一般来说,估计和统计推断的目标是在哪些节点间存在边,也就是从节点数据中恢复整个网络的样貌。现代统计学和生物统计学中,概率图模型多研究高维统计的情景,即样本量远小于随机变量数目: n p {\displaystyle n\ll p} 。一般的方法是假设图模型是一个高度稀疏的图,也就是只有几条很少的边,然后运用惩罚项或边际过滤等高维统计分析中的常用套路来获得稀疏的估计。这样的估计既可以是同时估计整个图中所有的边,也可以是对每一个节点估计其所连的边。理论研究多集中于各种惩罚项所估计出的图模型,其稀疏性质的正确性(这个概念叫做Sparsistency,注意它并不是相合性(Consistency))。

相关

  • 锝-99m锝-99m是锝-99的核同质异能素。化学符号是Tc-99m,半衰期为6小时。占全世界医疗用放射性元素的80%,其中90%用于扫描诊断,像是单光子电脑断层扫描(英语:Single-photon emission com
  • 伯父伯父是中文中对亲属的称谓,指父亲的哥哥,也叫伯伯、阿伯、堂伯,或简称伯。古称从父。不过,“伯”也可以指大伯子,即丈夫的哥哥。英文中,伯父与叔父、舅父等统称为Uncle。伯父妻子
  • 潘基文潘基文(韩语:반기문,1944年6月13日-),前大韩民国外交通商部长官,第8任联合国秘书长,现任国际奥林匹克委员会道德委员会主席,博鳌亚洲论坛理事长。1944年6月13日,潘基文出生于今韩国忠
  • 皮胆虫皮胆虫(学名:Picozoa,Picobiliphytes或Picobiliphyta)是一类水生单细胞异养真核生物,尺寸小于约3微米。第一种被明确归为此类的生物是。 他们可能属于原始色素体生物,并作为红藻的
  • 闭前不圆唇元音闭前不圆唇母音是母音的一种,使用于许多口语语言之中,其国际音标的符号为 ⟨i⟩,相对应的X-SAMPA符号则为 ⟨i⟩。此母音非常普遍,几乎在所有超过三个母音的语言中都存在着。表
  • 鳍斑猪齿鱼鳍斑猪齿鱼(学名:Choerodon monostigma),为辐鳍鱼纲鲈形目隆头鱼亚目隆头鱼科的其中一种,分布于澳洲西北部及巴布亚新几内亚海域,本鱼体大部分为灰白色,具有模糊的暗色条纹,背鳍棘后
  • Spike Chunsoft Spike Chunsoft株式会社(日语:株式会社スパイク・チュンソフト)是日本的一家电子游戏开发商及发行商,从属于多玩国。公司成立于2012年4月1日,由日本游戏厂商Spike和Chunsoft合并
  • 邵鼎曾邵鼎曾,浙江人,是一名清朝政治人物。邵鼎曾曾于1853年接替章惠代理南汇县知县一职,同年年由富克精阿接任。
  • 世界第八大奇迹世界第八大奇迹(Eighth Wonder of the World)是指一些被认为可以与世界七大奇迹相提并论的事物。以下列出被称为“世界第八大奇迹”的事物:
  • 前推 (微分)假设  : → 是光滑流形之间的光滑映射;则 在一点 处的微分在某种意义上是 在 附近的最佳线性逼近。这可以视为通常微积分中全导数的推广。确切地说,它是从 在 处的切