图模式

✍ dations ◷ 2025-06-28 17:27:37 #图模式
在概率论、统计学及机器学习中,概率图模型(Graphical Model)是用图论方法以表现数个独立随机变量之关联的一种建模法。一个 p {displaystyle p} 个节点的图中,节点 i {displaystyle i} 对应一个随机变量,记为 X i {displaystyle X_{i}} 。概率图模型被广泛地应用于贝叶斯统计与机器学习中。在一个无向概率图模型(Undirected Graphical Model)中,两个节点 i {displaystyle i} 和 j {displaystyle j} 之间没有边相连,当且仅当它们对应的随机变量 X i {displaystyle X_{i}} 和 X j {displaystyle X_{j}} 给定其它所有节点上的随机变量条件下条件独立。数学表述为:Θ i j = 0 ⇔ X i ⊥ X j | { X ℓ , ℓ = 1 , … , p , ℓ ≠ i , ℓ ≠ j } {displaystyle Theta _{ij}=0Leftrightarrow X_{i}perp X_{j}|{X_{ell },ell =1,ldots ,p,ell neq i,ell neq j}}当所有的随机变量 X 1 , … , X p {displaystyle X_{1},ldots ,X_{p}} 的联合分布是多元正态分布时, Θ {displaystyle Theta } 被理解为是多元正态分布的方差矩阵的逆 Θ = Σ − 1 {displaystyle Theta =Sigma ^{-1}} ,又称为精度矩阵(Precision Matrix)。现代统计学中,相当大比例的关于无向图模型的理论结果都是在多元正态分布的假设下取得的。在一个有向概率图模型(Directed Graphical Model)中,两个节点 i {displaystyle i} 和 j {displaystyle j} 之间的边际独立性和条件独立性比较复杂,一般需要用贝叶斯球规则(Bayes Ball)来确定。一类很重要的有向概率图模型叫做有向无环概率图模型(Directed Acyclic Graphs, 简称DAG),可以证明,相互关系能用DAG表示的p个随机变量,其联合分布函数可以被分解为根节点的边际分布函数乘以由边决定的那些条件概率。数学表述为:π ( X 1 , … , X p ) = ∏ i ∈ I π ( X i ) × ∏ j ∈ J π ( X j | X Parent ( j ) ) {displaystyle pi (X_{1},ldots ,X_{p})=prod _{iin {cal {I}}}pi (X_{i})times prod _{jin {cal {J}}}pi (X_{j}|X_{{textrm {Parent}}(j)})}上式中, I {displaystyle {cal {I}}} 表示所有根节点的集合, J {displaystyle {cal {J}}} 表示所有其它节点的集合, Parent ( j ) {displaystyle {textrm {Parent}}(j)} 表示有向图中节点 j {displaystyle j} 的所有父节点的集合。一般概率图模型输入的数据是其节点上的随机变量 ( X 1 , … , X p ) {displaystyle (X_{1},ldots ,X_{p})} 的独立重复观测值,可记为:( X 1 ( k ) , … , X p ( k ) ) , k = 1 , … , n {displaystyle (X_{1}^{(k)},ldots ,X_{p}^{(k)}),k=1,ldots ,n}其中 n {displaystyle n} 为样本量(Sample size)。一般来说,估计和统计推断的目标是在哪些节点间存在边,也就是从节点数据中恢复整个网络的样貌。现代统计学和生物统计学中,概率图模型多研究高维统计的情景,即样本量远小于随机变量数目: n ≪ p {displaystyle nll p} 。一般的方法是假设图模型是一个高度稀疏的图,也就是只有几条很少的边,然后运用惩罚项或边际过滤等高维统计分析中的常用套路来获得稀疏的估计。这样的估计既可以是同时估计整个图中所有的边,也可以是对每一个节点估计其所连的边。理论研究多集中于各种惩罚项所估计出的图模型,其稀疏性质的正确性(这个概念叫做Sparsistency,注意它并不是相合性(Consistency))。

相关

  • 多重人格分离性身份识别障碍,或多重人格,是心理疾病的一种,常与精神分裂症搞混,较早的《精神疾病诊断与统计手册》(DSM)版本将其命名为多重人格障碍(Multiple Personality Disorder,MPD),后来
  • 法兰西共和国 (消歧义)法兰西共和国(法语:La République française)即共和制的法兰西(法国),对该词可以有各种不同见解,大致上指的是:
  • 奥斯瓦尔德·埃弗里奥斯伍尔德·西奥多·埃弗里(英语:Oswald Theodore Avery,1877年10月21日-1955年2月2日),美国医生、最早的分子生物学家之一、免疫化学先驱,曾长期在纽约市洛克菲勒研究院附属医院
  • 苏菜苏菜即江苏菜,中国四大菜系之一。一般认为苏菜内部分为四大派系:
  • 六腑六府,又作六腑,中医术语,代表人身中的六个器官:大肠、小肠、胃、膀胱、三焦、胆,与五脏相应。六府的起源很早,在《吕氏春秋》中就有提到。府的意思,是宫府,居室。因为它们流转受纳,所
  • 经济制裁经济制裁(Economic sanctions),采用断绝外交关系以外的非武力强制性措施。泛指全面性的贸易中止、特定物资禁运、人员禁入(travel bans),以及金融资产之冻结(freeze)。一般认为,财政
  • 固溶体固溶体是指溶质原子溶入溶剂晶格中而仍保持溶剂类型的合金相。通常以一种化学物质为基体溶有其他物质的原子或分子所组成的晶体,在合金和硅酸盐系统中较多见,在多原子物质中亦
  • SHGb02+14a无线电信号SHGb02+14a无线电信号是搜寻地外文明计划(SETI)截获的一个疑似外星信号,由SETI@home于2003年3月发现,并于2004年9月1日公布。该信号总共被观察到三次,信号的频率为1420兆赫兹,这一
  • 蒂莫西·布利斯蒂莫西·维维安·佩勒姆·布利斯(Timothy Vivian Pelham Bliss,生于1940年7月27日)是一位英国神经学家。1968至2006年在国家医学研究所工作,任神经科学主管。他还是伦敦大学学院
  • 泊松回归在统计学上,泊松回归(英语:Poisson regression)是用来为计数资料和列联表建模的一种回归分析。泊松回归假设反应变量Y是泊松分布,并假设它期望值的对数可由一组未知参数进行线性