首页 >
图模式
✍ dations ◷ 2025-10-27 17:06:46 #图模式
在概率论、统计学及机器学习中,概率图模型(Graphical Model)是用图论方法以表现数个独立随机变量之关联的一种建模法。一个
p
{displaystyle p}
个节点的图中,节点
i
{displaystyle i}
对应一个随机变量,记为
X
i
{displaystyle X_{i}}
。概率图模型被广泛地应用于贝叶斯统计与机器学习中。在一个无向概率图模型(Undirected Graphical Model)中,两个节点
i
{displaystyle i}
和
j
{displaystyle j}
之间没有边相连,当且仅当它们对应的随机变量
X
i
{displaystyle X_{i}}
和
X
j
{displaystyle X_{j}}
给定其它所有节点上的随机变量条件下条件独立。数学表述为:Θ
i
j
=
0
⇔
X
i
⊥
X
j
|
{
X
ℓ
,
ℓ
=
1
,
…
,
p
,
ℓ
≠
i
,
ℓ
≠
j
}
{displaystyle Theta _{ij}=0Leftrightarrow X_{i}perp X_{j}|{X_{ell },ell =1,ldots ,p,ell neq i,ell neq j}}当所有的随机变量
X
1
,
…
,
X
p
{displaystyle X_{1},ldots ,X_{p}}
的联合分布是多元正态分布时,
Θ
{displaystyle Theta }
被理解为是多元正态分布的方差矩阵的逆
Θ
=
Σ
−
1
{displaystyle Theta =Sigma ^{-1}}
,又称为精度矩阵(Precision Matrix)。现代统计学中,相当大比例的关于无向图模型的理论结果都是在多元正态分布的假设下取得的。在一个有向概率图模型(Directed Graphical Model)中,两个节点
i
{displaystyle i}
和
j
{displaystyle j}
之间的边际独立性和条件独立性比较复杂,一般需要用贝叶斯球规则(Bayes Ball)来确定。一类很重要的有向概率图模型叫做有向无环概率图模型(Directed Acyclic Graphs, 简称DAG),可以证明,相互关系能用DAG表示的p个随机变量,其联合分布函数可以被分解为根节点的边际分布函数乘以由边决定的那些条件概率。数学表述为:π
(
X
1
,
…
,
X
p
)
=
∏
i
∈
I
π
(
X
i
)
×
∏
j
∈
J
π
(
X
j
|
X
Parent
(
j
)
)
{displaystyle pi (X_{1},ldots ,X_{p})=prod _{iin {cal {I}}}pi (X_{i})times prod _{jin {cal {J}}}pi (X_{j}|X_{{textrm {Parent}}(j)})}上式中,
I
{displaystyle {cal {I}}}
表示所有根节点的集合,
J
{displaystyle {cal {J}}}
表示所有其它节点的集合,
Parent
(
j
)
{displaystyle {textrm {Parent}}(j)}
表示有向图中节点
j
{displaystyle j}
的所有父节点的集合。一般概率图模型输入的数据是其节点上的随机变量
(
X
1
,
…
,
X
p
)
{displaystyle (X_{1},ldots ,X_{p})}
的独立重复观测值,可记为:(
X
1
(
k
)
,
…
,
X
p
(
k
)
)
,
k
=
1
,
…
,
n
{displaystyle (X_{1}^{(k)},ldots ,X_{p}^{(k)}),k=1,ldots ,n}其中
n
{displaystyle n}
为样本量(Sample size)。一般来说,估计和统计推断的目标是在哪些节点间存在边,也就是从节点数据中恢复整个网络的样貌。现代统计学和生物统计学中,概率图模型多研究高维统计的情景,即样本量远小于随机变量数目:
n
≪
p
{displaystyle nll p}
。一般的方法是假设图模型是一个高度稀疏的图,也就是只有几条很少的边,然后运用惩罚项或边际过滤等高维统计分析中的常用套路来获得稀疏的估计。这样的估计既可以是同时估计整个图中所有的边,也可以是对每一个节点估计其所连的边。理论研究多集中于各种惩罚项所估计出的图模型,其稀疏性质的正确性(这个概念叫做Sparsistency,注意它并不是相合性(Consistency))。
相关
- 蒸发蒸发是液体表面汽化的过程,与另一汽化过程“沸腾”不同的是,蒸发只会发生于液体的表面,而且可在任何温度发生。在工业生产中,一般需要加热,可以在低于沸点时蒸发,也可以在沸点时进
- 血脑障壁脑血管障壁(英语:blood–brain barrier ,BBB),也称为血脑屏障或血脑障壁,指在血管和脑之间有一种选择性地阻止某些物质由血液进入大脑的“屏障”。19世纪末,保罗·埃尔利希在一个实
- 松弛素松弛素(Relaxin)是一种分子量约为6000Da的蛋白质激素 在1926年由弗雷德里克·海撒(Frederick Hisaw)发现。似松弛素胜肽家族(relaxin-like peptide family)属于胰岛素超家族,
- 疟原虫属疟原虫属(Plasmodium)是一类单细胞、寄生性的囊泡虫。本属生物通称为疟原虫。本属生物中有五种疟原虫会使人类感染疟疾,包括恶性疟原虫(Plasmodium falciparum)、三日疟原虫(Plasm
- III型分泌系统III型分泌系统(英语:Type III secretion system 缩写TTSS或T3SS)是革兰氏阴性菌的一个由多组分蛋白复合体形成的跨膜通道,它通过分泌蛋白,或把这些毒力蛋白直接注入宿主细胞中发
- 芬兰湾芬兰湾(芬兰语:Suomenlahti;爱沙尼亚语:Soome laht;俄语:Финский залив, Finskiy zaliv;瑞典语:Finska viken)是波罗的海东部的大海湾,位于芬兰、爱沙尼亚之间,伸展至俄罗
- 阿肯那顿阿蒙霍特普四世(按不同的时间体系估计,去世于前1351年-前1334年之间),后改名埃赫那吞(Akhenaten,亦译做埃赫那顿),古埃及第十八王朝法老。阿蒙霍特普四世是第十八王朝全盛时期的法老
- 阿罗哈客运阿罗哈客运股份有限公司(英语:Aloha Bus Company, Ltd.),简称阿罗哈客运,前身为世昌通运,现时这家客运公司为高雄市的国道客运公司,现时有三条国道客运路线,分别为3888台北-嘉义,3999
- 平方米平方米,又称为“平方公尺”(符号为m2)是面积的公制单位,其定义是“在一平面上,边长为一米的正方形之面积”。中国大陆在表示房间面积等时又常简称为“平米”或“平”。(1km²=1000
- 血管瘤血管瘤(Angiomas)是血管、淋巴管管壁或其周围组织的细胞增生形成的良性肿瘤 。血管瘤的发生率随着患者年龄的增长而增加。血管瘤的发生可能是系统性疾病如肝脏疾病的一个指标,
