图模式

✍ dations ◷ 2025-08-06 19:20:37 #图模式
在概率论、统计学及机器学习中,概率图模型(Graphical Model)是用图论方法以表现数个独立随机变量之关联的一种建模法。一个 p {displaystyle p} 个节点的图中,节点 i {displaystyle i} 对应一个随机变量,记为 X i {displaystyle X_{i}} 。概率图模型被广泛地应用于贝叶斯统计与机器学习中。在一个无向概率图模型(Undirected Graphical Model)中,两个节点 i {displaystyle i} 和 j {displaystyle j} 之间没有边相连,当且仅当它们对应的随机变量 X i {displaystyle X_{i}} 和 X j {displaystyle X_{j}} 给定其它所有节点上的随机变量条件下条件独立。数学表述为:Θ i j = 0 ⇔ X i ⊥ X j | { X ℓ , ℓ = 1 , … , p , ℓ ≠ i , ℓ ≠ j } {displaystyle Theta _{ij}=0Leftrightarrow X_{i}perp X_{j}|{X_{ell },ell =1,ldots ,p,ell neq i,ell neq j}}当所有的随机变量 X 1 , … , X p {displaystyle X_{1},ldots ,X_{p}} 的联合分布是多元正态分布时, Θ {displaystyle Theta } 被理解为是多元正态分布的方差矩阵的逆 Θ = Σ − 1 {displaystyle Theta =Sigma ^{-1}} ,又称为精度矩阵(Precision Matrix)。现代统计学中,相当大比例的关于无向图模型的理论结果都是在多元正态分布的假设下取得的。在一个有向概率图模型(Directed Graphical Model)中,两个节点 i {displaystyle i} 和 j {displaystyle j} 之间的边际独立性和条件独立性比较复杂,一般需要用贝叶斯球规则(Bayes Ball)来确定。一类很重要的有向概率图模型叫做有向无环概率图模型(Directed Acyclic Graphs, 简称DAG),可以证明,相互关系能用DAG表示的p个随机变量,其联合分布函数可以被分解为根节点的边际分布函数乘以由边决定的那些条件概率。数学表述为:π ( X 1 , … , X p ) = ∏ i ∈ I π ( X i ) × ∏ j ∈ J π ( X j | X Parent ( j ) ) {displaystyle pi (X_{1},ldots ,X_{p})=prod _{iin {cal {I}}}pi (X_{i})times prod _{jin {cal {J}}}pi (X_{j}|X_{{textrm {Parent}}(j)})}上式中, I {displaystyle {cal {I}}} 表示所有根节点的集合, J {displaystyle {cal {J}}} 表示所有其它节点的集合, Parent ( j ) {displaystyle {textrm {Parent}}(j)} 表示有向图中节点 j {displaystyle j} 的所有父节点的集合。一般概率图模型输入的数据是其节点上的随机变量 ( X 1 , … , X p ) {displaystyle (X_{1},ldots ,X_{p})} 的独立重复观测值,可记为:( X 1 ( k ) , … , X p ( k ) ) , k = 1 , … , n {displaystyle (X_{1}^{(k)},ldots ,X_{p}^{(k)}),k=1,ldots ,n}其中 n {displaystyle n} 为样本量(Sample size)。一般来说,估计和统计推断的目标是在哪些节点间存在边,也就是从节点数据中恢复整个网络的样貌。现代统计学和生物统计学中,概率图模型多研究高维统计的情景,即样本量远小于随机变量数目: n ≪ p {displaystyle nll p} 。一般的方法是假设图模型是一个高度稀疏的图,也就是只有几条很少的边,然后运用惩罚项或边际过滤等高维统计分析中的常用套路来获得稀疏的估计。这样的估计既可以是同时估计整个图中所有的边,也可以是对每一个节点估计其所连的边。理论研究多集中于各种惩罚项所估计出的图模型,其稀疏性质的正确性(这个概念叫做Sparsistency,注意它并不是相合性(Consistency))。

相关

  • 参与经济参与型经济(Participatory economics,简称parecon)是一个还在设想阶段的经济体制。该体制通过平等参与来作经济决定,引导一个社会的资源配置和消费。该体制的目标是替代当代资本
  • 萨摩斯岛萨摩斯岛(Σάμος),是希腊第9大岛屿,位于北爱琴、希俄斯岛以南,帕特莫斯岛和多德卡尼斯以北,东临安纳托利亚海岸。该岛面积478平方千米,岛上人口33,814人,是第9多人居住的岛屿,首
  • 草津温泉草津温泉(日语:草津温泉/くさつおんせん),位于日本群马县吾妻郡草津町的温泉名胜地。其起源已有千年之久。草津温泉的pH值在1.7至2.1,是强酸性硫黄泉,具有医疗功效。林罗山的日本三
  • 斯蒂芬·利帕德斯蒂芬·J·利帕德(英语:Stephen J. Lippard,1940年10月12日-),美国生物无机化学家、麻省理工学院阿瑟·阿莫斯·诺伊斯化学教授。1965年获麻省理工学院博士学位。他的实验室发现
  • 巴尔扎克奥诺雷·德·巴尔扎克(法语:Honoré de Balzac,1799年5月20日-1850年8月18日),原名奥诺雷·巴尔扎克(Honoré Balzac),法国19世纪著名作家,法国现实主义文学成就最高者之一。他创作的
  • 温布利球场温布利球场(Wembley Stadium)是一个位于英格兰伦敦的温布利的专业足球场。球场拥有90,000个座位,容量为欧洲第二大,仅次于诺坎普球场,温布利球场上的天幕所占面积是全球第一大,看
  • 混农林业混农林业(英文:Agroforestry或Agro-sylviculture)或称农林间作、农业森林学、混农森林学、农用林业、农林混作系统、混林农业等,是一种结合林业与农业间土地利用的研究学科或者
  • 直布罗陀2019冠状病毒病直布罗陀疫情,介绍在2019新型冠状病毒疫情中,在直布罗陀发生的情况。2020年3月4日,直布罗陀确诊首例新冠肺炎病例,患者有意大利旅行史,处于自我隔离状态。3月7日,该
  • 联邦政府行政部门美国联邦行政部门(英语:United States Federal Executive Departments)是对于美国联邦政府中由总统指挥的行政机构总称,目前共有15个联邦行政部门;其中包含历史最为悠久的主要单
  • 一厢情愿一厢情愿(wishful thinking)是基于美好的想像而非基于理性思考和客观证据形成信念,是一种认知偏差。其形式是:我希望X是对的,因此我相信X是对的。一厢情愿谬误是基于一厢情愿的信念