图模式

✍ dations ◷ 2025-04-04 11:53:19 #图模式
在概率论、统计学及机器学习中,概率图模型(Graphical Model)是用图论方法以表现数个独立随机变量之关联的一种建模法。一个 p {displaystyle p} 个节点的图中,节点 i {displaystyle i} 对应一个随机变量,记为 X i {displaystyle X_{i}} 。概率图模型被广泛地应用于贝叶斯统计与机器学习中。在一个无向概率图模型(Undirected Graphical Model)中,两个节点 i {displaystyle i} 和 j {displaystyle j} 之间没有边相连,当且仅当它们对应的随机变量 X i {displaystyle X_{i}} 和 X j {displaystyle X_{j}} 给定其它所有节点上的随机变量条件下条件独立。数学表述为:Θ i j = 0 ⇔ X i ⊥ X j | { X ℓ , ℓ = 1 , … , p , ℓ ≠ i , ℓ ≠ j } {displaystyle Theta _{ij}=0Leftrightarrow X_{i}perp X_{j}|{X_{ell },ell =1,ldots ,p,ell neq i,ell neq j}}当所有的随机变量 X 1 , … , X p {displaystyle X_{1},ldots ,X_{p}} 的联合分布是多元正态分布时, Θ {displaystyle Theta } 被理解为是多元正态分布的方差矩阵的逆 Θ = Σ − 1 {displaystyle Theta =Sigma ^{-1}} ,又称为精度矩阵(Precision Matrix)。现代统计学中,相当大比例的关于无向图模型的理论结果都是在多元正态分布的假设下取得的。在一个有向概率图模型(Directed Graphical Model)中,两个节点 i {displaystyle i} 和 j {displaystyle j} 之间的边际独立性和条件独立性比较复杂,一般需要用贝叶斯球规则(Bayes Ball)来确定。一类很重要的有向概率图模型叫做有向无环概率图模型(Directed Acyclic Graphs, 简称DAG),可以证明,相互关系能用DAG表示的p个随机变量,其联合分布函数可以被分解为根节点的边际分布函数乘以由边决定的那些条件概率。数学表述为:π ( X 1 , … , X p ) = ∏ i ∈ I π ( X i ) × ∏ j ∈ J π ( X j | X Parent ( j ) ) {displaystyle pi (X_{1},ldots ,X_{p})=prod _{iin {cal {I}}}pi (X_{i})times prod _{jin {cal {J}}}pi (X_{j}|X_{{textrm {Parent}}(j)})}上式中, I {displaystyle {cal {I}}} 表示所有根节点的集合, J {displaystyle {cal {J}}} 表示所有其它节点的集合, Parent ( j ) {displaystyle {textrm {Parent}}(j)} 表示有向图中节点 j {displaystyle j} 的所有父节点的集合。一般概率图模型输入的数据是其节点上的随机变量 ( X 1 , … , X p ) {displaystyle (X_{1},ldots ,X_{p})} 的独立重复观测值,可记为:( X 1 ( k ) , … , X p ( k ) ) , k = 1 , … , n {displaystyle (X_{1}^{(k)},ldots ,X_{p}^{(k)}),k=1,ldots ,n}其中 n {displaystyle n} 为样本量(Sample size)。一般来说,估计和统计推断的目标是在哪些节点间存在边,也就是从节点数据中恢复整个网络的样貌。现代统计学和生物统计学中,概率图模型多研究高维统计的情景,即样本量远小于随机变量数目: n ≪ p {displaystyle nll p} 。一般的方法是假设图模型是一个高度稀疏的图,也就是只有几条很少的边,然后运用惩罚项或边际过滤等高维统计分析中的常用套路来获得稀疏的估计。这样的估计既可以是同时估计整个图中所有的边,也可以是对每一个节点估计其所连的边。理论研究多集中于各种惩罚项所估计出的图模型,其稀疏性质的正确性(这个概念叫做Sparsistency,注意它并不是相合性(Consistency))。

相关

  • 贫血贫血(英语:anemia, anaemia,拉丁语:anæmia)通常定义为血液中红血球或血红素总数量下降的情形;也可以被定义为血液携带氧气能力下降的情况。当贫血慢性发作时,其症状往往不明显,可能
  • 缩写缩写(英语:Abbreviation(Abbrev),来自拉丁语 brevis,意为“短”),在语言学里是一种词语或短语的简易形式,又称省略、缩略语、缩写词。缩写大部分时候等同于简称,但它们之间有细微的差
  • 大洋洲大洋洲(英语:Oceania),是指地缘政治学,将澳大利亚洲与太平洋诸岛屿并称的地理区域,大洋洲并不是地质学上严格意义的“大洲”,占全球总陆地面积的6%。在4万至12万5千年前,澳大利亚土
  • 多音字陶文 ‧ 甲骨文 ‧ 金文 ‧ 古文 ‧ 石鼓文籀文 ‧ 鸟虫书 ‧ 篆书(大篆 ‧  小篆)隶书 ‧ 楷书 ‧ 行书 ‧ 草书漆书 ‧  书法 ‧ 飞白书笔画 ‧ 
  • 苯二酚苯二酚(benzenediol)即二羟基苯(dihydroxybenzene),苯分子中两个氢原子被两个羟基取代后的衍生物。化学式为C6H4(OH)2,有以下三个异构体:邻苯二酚间苯二酚对苯二酚这三种二元酚的性
  • 走部,为汉字索引中的部首之一,康熙字典214个部首中的第一百五十六个(七划的则为第十个)。就繁体和简体中文中,走部归于七划部首。走部只以左方为部字,将字底下括起来。且无其他部
  • 热月政变热月党人 胜利:热月党人:支持者:国民公会 法国政府:支持者:多方面的人员被处决 :热月政变(法语:Coup d'Etat du 9 Thermidor)是法国大革命期间反对雅各宾俱乐部领导人主导公共
  • 遗传因子基因(英语:gene)在生物学中指DNA或RNA内编码基因产物(RNA或蛋白质)的合成的核苷酸序列。基因也可视作基本遗传单位,亦即一段具有功能性的DNA或RNA序列。弄清其序列本身的过程叫基
  • 赵宇亮赵宇亮(1963年2月-),四川南充人,中国化学家,国家纳米科学中心、中国科学院高能物理研究所研究员。2017年当选为中国科学院院士。1985年毕业于四川大学化学系,1996和1999年在日本东
  • 契丹人契丹人,古代游牧民族,居住在今蒙古国及中国东北地区,采取半农半牧生活,语言属蒙古语族,但受通古斯语族强烈影响。而目前居住中国东北的达斡尔族可认定为契丹人直系后裔,部分吉尔吉