图模式

✍ dations ◷ 2025-06-07 12:46:31 #图模式
在概率论、统计学及机器学习中,概率图模型(Graphical Model)是用图论方法以表现数个独立随机变量之关联的一种建模法。一个 p {displaystyle p} 个节点的图中,节点 i {displaystyle i} 对应一个随机变量,记为 X i {displaystyle X_{i}} 。概率图模型被广泛地应用于贝叶斯统计与机器学习中。在一个无向概率图模型(Undirected Graphical Model)中,两个节点 i {displaystyle i} 和 j {displaystyle j} 之间没有边相连,当且仅当它们对应的随机变量 X i {displaystyle X_{i}} 和 X j {displaystyle X_{j}} 给定其它所有节点上的随机变量条件下条件独立。数学表述为:Θ i j = 0 ⇔ X i ⊥ X j | { X ℓ , ℓ = 1 , … , p , ℓ ≠ i , ℓ ≠ j } {displaystyle Theta _{ij}=0Leftrightarrow X_{i}perp X_{j}|{X_{ell },ell =1,ldots ,p,ell neq i,ell neq j}}当所有的随机变量 X 1 , … , X p {displaystyle X_{1},ldots ,X_{p}} 的联合分布是多元正态分布时, Θ {displaystyle Theta } 被理解为是多元正态分布的方差矩阵的逆 Θ = Σ − 1 {displaystyle Theta =Sigma ^{-1}} ,又称为精度矩阵(Precision Matrix)。现代统计学中,相当大比例的关于无向图模型的理论结果都是在多元正态分布的假设下取得的。在一个有向概率图模型(Directed Graphical Model)中,两个节点 i {displaystyle i} 和 j {displaystyle j} 之间的边际独立性和条件独立性比较复杂,一般需要用贝叶斯球规则(Bayes Ball)来确定。一类很重要的有向概率图模型叫做有向无环概率图模型(Directed Acyclic Graphs, 简称DAG),可以证明,相互关系能用DAG表示的p个随机变量,其联合分布函数可以被分解为根节点的边际分布函数乘以由边决定的那些条件概率。数学表述为:π ( X 1 , … , X p ) = ∏ i ∈ I π ( X i ) × ∏ j ∈ J π ( X j | X Parent ( j ) ) {displaystyle pi (X_{1},ldots ,X_{p})=prod _{iin {cal {I}}}pi (X_{i})times prod _{jin {cal {J}}}pi (X_{j}|X_{{textrm {Parent}}(j)})}上式中, I {displaystyle {cal {I}}} 表示所有根节点的集合, J {displaystyle {cal {J}}} 表示所有其它节点的集合, Parent ( j ) {displaystyle {textrm {Parent}}(j)} 表示有向图中节点 j {displaystyle j} 的所有父节点的集合。一般概率图模型输入的数据是其节点上的随机变量 ( X 1 , … , X p ) {displaystyle (X_{1},ldots ,X_{p})} 的独立重复观测值,可记为:( X 1 ( k ) , … , X p ( k ) ) , k = 1 , … , n {displaystyle (X_{1}^{(k)},ldots ,X_{p}^{(k)}),k=1,ldots ,n}其中 n {displaystyle n} 为样本量(Sample size)。一般来说,估计和统计推断的目标是在哪些节点间存在边,也就是从节点数据中恢复整个网络的样貌。现代统计学和生物统计学中,概率图模型多研究高维统计的情景,即样本量远小于随机变量数目: n ≪ p {displaystyle nll p} 。一般的方法是假设图模型是一个高度稀疏的图,也就是只有几条很少的边,然后运用惩罚项或边际过滤等高维统计分析中的常用套路来获得稀疏的估计。这样的估计既可以是同时估计整个图中所有的边,也可以是对每一个节点估计其所连的边。理论研究多集中于各种惩罚项所估计出的图模型,其稀疏性质的正确性(这个概念叫做Sparsistency,注意它并不是相合性(Consistency))。

相关

  • 盆腔炎骨盆腔发炎(Pelvic inflammatory disease,PID)也称为盆腔炎,指的是女性子宫或输卵管受到感染的情形,有些定义也包含卵巢感染。骨盆腔发炎时常无明显的症状可能病征有下腹痛、阴道
  • 伪斜体伪斜体(oblique type)是西文字体的一种样式,是在正常字体样式基础上,通过倾斜字体实现的一种字体样式。西文中有两种斜体:oblique type和 Italic type。倾斜时伴随着字形的变化的
  • 接口在中国大陆,port的中文译名为“端口”或“接口”。interface的中文译名为“界面”或“接口”。在台湾,port的中文译名为“埠”,interface的中文译名为“介面”。当接口是port或
  • 数组在计算机科学中,数组数据结构(英语:array data structure),简称数组(英语:Array),是由相同类型的元素(element)的集合所组成的数据结构,分配一块连续的内存来存储。利用元素的索引(index)
  • 浏览器网页浏览器(英语:Web Browser,常简称为浏览器)是一种用于检索并展示万维网信息资源的应用程序。这些信息资源可为网页、图片、影音或其他内容,它们由统一资源标志符标识。信息资
  • 克劳斯苯克劳斯苯(Claus' benzene)是描述苯的分子结构的一种假设,由德国化学家克劳斯(英语:Adolf Karl Ludwig Claus)于1867年提出。这种结构又称对位键结构式,分子中每个碳原子与相邻两个
  • 寸部,为汉字索引里为部首之一,康熙字典214个部首中的第四十一个(三划的则为第十二个)。就繁体和简体中文中,寸部归于三划部首。寸部通常是从下、右方均可为部字,且无其他部首可用
  • 乔瓦尼·斯帕多利尼乔瓦尼·斯帕多利尼(Giovanni Spadolini) (1925年6月21日-1994年8月4日) 意大利自由主义政治家,第45位意大利总理、报纸编辑、记者和著名的历史学家。斯帕多利尼出生于佛罗伦
  • 自治市荷兰政府与政治 系列条目荷兰所有的省份的下一级行政区划均为市镇(荷兰语:gemeenten)。截至2019年1月,荷兰共有355个市镇和3个“特别市”(正式名称为公共实体,openbare lichamen)。
  • 隐遁的伊玛目阿里 · 哈桑 · 侯赛因 萨贾德 · 巴基尔 · 萨迪克 穆萨 · 伊斯迈尔穆罕默德·马赫迪·蒙塔扎尔(阿拉伯语:محمد المهدي المنتظر‎),意为“被期待的救世主