图模式

✍ dations ◷ 2025-04-02 13:21:32 #图模式
在概率论、统计学及机器学习中,概率图模型(Graphical Model)是用图论方法以表现数个独立随机变量之关联的一种建模法。一个 p {displaystyle p} 个节点的图中,节点 i {displaystyle i} 对应一个随机变量,记为 X i {displaystyle X_{i}} 。概率图模型被广泛地应用于贝叶斯统计与机器学习中。在一个无向概率图模型(Undirected Graphical Model)中,两个节点 i {displaystyle i} 和 j {displaystyle j} 之间没有边相连,当且仅当它们对应的随机变量 X i {displaystyle X_{i}} 和 X j {displaystyle X_{j}} 给定其它所有节点上的随机变量条件下条件独立。数学表述为:Θ i j = 0 ⇔ X i ⊥ X j | { X ℓ , ℓ = 1 , … , p , ℓ ≠ i , ℓ ≠ j } {displaystyle Theta _{ij}=0Leftrightarrow X_{i}perp X_{j}|{X_{ell },ell =1,ldots ,p,ell neq i,ell neq j}}当所有的随机变量 X 1 , … , X p {displaystyle X_{1},ldots ,X_{p}} 的联合分布是多元正态分布时, Θ {displaystyle Theta } 被理解为是多元正态分布的方差矩阵的逆 Θ = Σ − 1 {displaystyle Theta =Sigma ^{-1}} ,又称为精度矩阵(Precision Matrix)。现代统计学中,相当大比例的关于无向图模型的理论结果都是在多元正态分布的假设下取得的。在一个有向概率图模型(Directed Graphical Model)中,两个节点 i {displaystyle i} 和 j {displaystyle j} 之间的边际独立性和条件独立性比较复杂,一般需要用贝叶斯球规则(Bayes Ball)来确定。一类很重要的有向概率图模型叫做有向无环概率图模型(Directed Acyclic Graphs, 简称DAG),可以证明,相互关系能用DAG表示的p个随机变量,其联合分布函数可以被分解为根节点的边际分布函数乘以由边决定的那些条件概率。数学表述为:π ( X 1 , … , X p ) = ∏ i ∈ I π ( X i ) × ∏ j ∈ J π ( X j | X Parent ( j ) ) {displaystyle pi (X_{1},ldots ,X_{p})=prod _{iin {cal {I}}}pi (X_{i})times prod _{jin {cal {J}}}pi (X_{j}|X_{{textrm {Parent}}(j)})}上式中, I {displaystyle {cal {I}}} 表示所有根节点的集合, J {displaystyle {cal {J}}} 表示所有其它节点的集合, Parent ( j ) {displaystyle {textrm {Parent}}(j)} 表示有向图中节点 j {displaystyle j} 的所有父节点的集合。一般概率图模型输入的数据是其节点上的随机变量 ( X 1 , … , X p ) {displaystyle (X_{1},ldots ,X_{p})} 的独立重复观测值,可记为:( X 1 ( k ) , … , X p ( k ) ) , k = 1 , … , n {displaystyle (X_{1}^{(k)},ldots ,X_{p}^{(k)}),k=1,ldots ,n}其中 n {displaystyle n} 为样本量(Sample size)。一般来说,估计和统计推断的目标是在哪些节点间存在边,也就是从节点数据中恢复整个网络的样貌。现代统计学和生物统计学中,概率图模型多研究高维统计的情景,即样本量远小于随机变量数目: n ≪ p {displaystyle nll p} 。一般的方法是假设图模型是一个高度稀疏的图,也就是只有几条很少的边,然后运用惩罚项或边际过滤等高维统计分析中的常用套路来获得稀疏的估计。这样的估计既可以是同时估计整个图中所有的边,也可以是对每一个节点估计其所连的边。理论研究多集中于各种惩罚项所估计出的图模型,其稀疏性质的正确性(这个概念叫做Sparsistency,注意它并不是相合性(Consistency))。

相关

  • 荷兰é¢ç§¯æµ·å°”å¾·å…°çœ(仅陆地é¢ç§¯)以下资讯是以2019年估计国家领袖国å†
  • 淀粉淀粉(英语:starch, amylum)是由通过糖苷键连接的大量葡萄糖单元组成的聚合碳水化合物,属于一种多糖。制造淀粉是绿色植物贮存能量的一种方式。淀粉也是人类饮食中最常见的碳水化
  • 婴儿按摩婴儿按摩(英语:Infant massage),是一种对婴儿进行按摩治疗(英语:massage therapy)的替代疗法。这种疗法已经在全球范围内实施,并且在西方国家越来越多地用于婴儿,支持其使用的科学证
  • 汉越音陶文 ‧ 甲骨文 ‧ 金文 ‧ 古文 ‧ 石鼓文籀文 ‧ 鸟虫书 ‧ 篆书(大篆 ‧  小篆)隶书 ‧ 楷书 ‧ 行书 ‧ 草书漆书 ‧  书法 ‧ 飞白书笔画 ‧ 
  • 字元编码字符编码(英语:Character encoding)、字集码是把字符集中的字符编码为指定集合中某一对象(例如:比特模式、自然数序列、8位组或者电脉冲),以便文本在计算机中存储和通过通信网络的
  • 西班牙国家男子篮球队西班牙国家男子篮球队是一支代表西班牙参加国际篮球赛事的球队。目前国际男子篮球排名为第二名。
  • 火山冬天火山冬天是一个关于全球气候变化的理论,该理论认为火山爆发后产生大量的火山灰、硫酸、水等物质到大气层中,提升地球对太阳的反照率,将太阳辐射大幅反照回地球外,导致全球气温下
  • 易北爱乐厅易北爱乐厅(Elbphilharmonie)是一座位于德国汉堡的音乐厅,是建设中的汉堡港城的一部分,位于仓库城的最西端,高达110米,是汉堡最高的居住建筑。音乐厅的一至七层使用了港口仓库A(Kai
  • 蓝鲸蓝鲸(学名:Balaenoptera musculus)是属于须鲸小目的海洋哺乳动物。蓝鲸不仅是地球上现存体型最大的动物,也是地球史上最大的动物,长超过33米,重达177公吨。蓝鲸的身躯瘦长,背部青灰
  • ǃ̃齿龈鼻搭嘴音(Alveolar nasal click)或龈后鼻搭嘴音(Postalveolar nasal click)是一种辅音,主要出现于南非的一些口语中。表示此音的国际音标(IPA)是⟨ǃ̃⟩或⟨ᵑǃ⟩,亦有部分语