图模式

✍ dations ◷ 2025-09-18 05:40:26 #图模式
在概率论、统计学及机器学习中,概率图模型(Graphical Model)是用图论方法以表现数个独立随机变量之关联的一种建模法。一个 p {displaystyle p} 个节点的图中,节点 i {displaystyle i} 对应一个随机变量,记为 X i {displaystyle X_{i}} 。概率图模型被广泛地应用于贝叶斯统计与机器学习中。在一个无向概率图模型(Undirected Graphical Model)中,两个节点 i {displaystyle i} 和 j {displaystyle j} 之间没有边相连,当且仅当它们对应的随机变量 X i {displaystyle X_{i}} 和 X j {displaystyle X_{j}} 给定其它所有节点上的随机变量条件下条件独立。数学表述为:Θ i j = 0 ⇔ X i ⊥ X j | { X ℓ , ℓ = 1 , … , p , ℓ ≠ i , ℓ ≠ j } {displaystyle Theta _{ij}=0Leftrightarrow X_{i}perp X_{j}|{X_{ell },ell =1,ldots ,p,ell neq i,ell neq j}}当所有的随机变量 X 1 , … , X p {displaystyle X_{1},ldots ,X_{p}} 的联合分布是多元正态分布时, Θ {displaystyle Theta } 被理解为是多元正态分布的方差矩阵的逆 Θ = Σ − 1 {displaystyle Theta =Sigma ^{-1}} ,又称为精度矩阵(Precision Matrix)。现代统计学中,相当大比例的关于无向图模型的理论结果都是在多元正态分布的假设下取得的。在一个有向概率图模型(Directed Graphical Model)中,两个节点 i {displaystyle i} 和 j {displaystyle j} 之间的边际独立性和条件独立性比较复杂,一般需要用贝叶斯球规则(Bayes Ball)来确定。一类很重要的有向概率图模型叫做有向无环概率图模型(Directed Acyclic Graphs, 简称DAG),可以证明,相互关系能用DAG表示的p个随机变量,其联合分布函数可以被分解为根节点的边际分布函数乘以由边决定的那些条件概率。数学表述为:π ( X 1 , … , X p ) = ∏ i ∈ I π ( X i ) × ∏ j ∈ J π ( X j | X Parent ( j ) ) {displaystyle pi (X_{1},ldots ,X_{p})=prod _{iin {cal {I}}}pi (X_{i})times prod _{jin {cal {J}}}pi (X_{j}|X_{{textrm {Parent}}(j)})}上式中, I {displaystyle {cal {I}}} 表示所有根节点的集合, J {displaystyle {cal {J}}} 表示所有其它节点的集合, Parent ( j ) {displaystyle {textrm {Parent}}(j)} 表示有向图中节点 j {displaystyle j} 的所有父节点的集合。一般概率图模型输入的数据是其节点上的随机变量 ( X 1 , … , X p ) {displaystyle (X_{1},ldots ,X_{p})} 的独立重复观测值,可记为:( X 1 ( k ) , … , X p ( k ) ) , k = 1 , … , n {displaystyle (X_{1}^{(k)},ldots ,X_{p}^{(k)}),k=1,ldots ,n}其中 n {displaystyle n} 为样本量(Sample size)。一般来说,估计和统计推断的目标是在哪些节点间存在边,也就是从节点数据中恢复整个网络的样貌。现代统计学和生物统计学中,概率图模型多研究高维统计的情景,即样本量远小于随机变量数目: n ≪ p {displaystyle nll p} 。一般的方法是假设图模型是一个高度稀疏的图,也就是只有几条很少的边,然后运用惩罚项或边际过滤等高维统计分析中的常用套路来获得稀疏的估计。这样的估计既可以是同时估计整个图中所有的边,也可以是对每一个节点估计其所连的边。理论研究多集中于各种惩罚项所估计出的图模型,其稀疏性质的正确性(这个概念叫做Sparsistency,注意它并不是相合性(Consistency))。

相关

  • 水危机水危机是联合国及其他国际组织用来泛指自1970年以来世界性的水资源相对人类需求的状况,主要的危机来源是可用水的匮乏以及水体污染。地球的淡水资源有限,主要出现在蓄水层、表
  • 淡水淡水,是水质中仅有微量溶解的氯化钠的水,是相对于海水或矿泉水的一种水体。大气降水、水汽凝结凝华、结晶水转化成自由水、火山爆发(存在争议)、彗星撞击。液态淡水和固态淡水,气
  • 嗜酸性粒细胞增多症嗜酸性粒细胞增多症是一种疾病过程其特点是血液中的嗜酸性粒细胞计数持续性地升高(多于1500嗜酸性粒细胞/立方毫米),没有明显的病因。嗜酸性粒细胞增多症有两种形式:心内膜纤维
  • At4f14 5d10 6s2 6p52, 8, 18, 32, 18, 7蒸气压主条目:砹的同位素砹(Astatine,台湾译作砈,旧讹作“鈪”、“銰”)是一种具有极高放射性的化学元素,符号为At,原子序为85。地球上所有的
  • 基础设施基建设施(英语:Infrastructure),亦称公共设施或公共建设,是指为社会生产和居民生活提供公共服务的物质工程设施,它是社会赖以生存发展的一般物质条件。基础设施不仅包括电网、通讯
  • 约瑟夫·李斯特约瑟夫·李斯特,第一代李斯特男爵,OM,FRS(英语:Joseph Lister, 1st Baron Lister,1827年4月5日-1912年2月10日),英国外科医生,外科手术消毒技术的发明者和推广者。李斯特生于厄普敦,父
  • 塔西陀普布利乌斯·科尔奈利乌斯·塔西陀(Publius或Gaius Cornelius Tacitus,也译作塔吉突士,55年?—117年?),罗马帝国执政官、雄辩家、元老院元老,也是著名的历史学家与文体家,他的最主要
  • 液滴模型液滴模型是一个关于原子核的模型。魏茨泽克公式将原子核的束缚能,表示成数个项之和。式中有部分常项由实验确定,变数则由理论推导出。一个原子核的束缚能可表示为:其中A为质量
  • 第10大进口国这是一个各国及地区进口列表,数据基于世界贸易组织,采用CIF统计各国及地区货物进口额。
  • 大伦敦大伦敦(英语:Greater London),位于英国英格兰东南部,是英格兰下属的一级行政区划之一,范围大致包含英国首都伦敦与其周围的卫星城镇所组成的都会区。行政上,该区域是在1965年时设置