贝叶斯网络

✍ dations ◷ 2025-08-14 11:37:00 #贝叶斯网络

贝叶斯网络（Bayesian network），又称信念网络（belief network）或是有向无环图模型（directed acyclic graphical model），是一种概率图型模型，借由有向无环图（directed acyclic graphs, or DAGs）中得知一组随机变量 { X 1 , X 2 , . . . , X n } {displaystyle left{X_{1},X_{2},...,X_{n}right}} 及其n组条件概率分布（conditional probability distributions, or CPDs）的性质。举例而言，贝叶斯网络可用来表示疾病和其相关症状间的概率关系；倘若已知某种症状下，贝叶斯网络就可用来计算各种可能罹患疾病之发生概率。一般而言，贝叶斯网络的有向无环图中的节点表示随机变量，它们可以是可观察到的变量，抑或是隐变量、未知参数等。连接两个节点的箭头代表此两个随机变量是具有因果关系或是非条件独立的；而两个节点间若没有箭头相互连接一起的情况就称其随机变量彼此间为条件独立。若两个节点间以一个单箭头连接在一起，表示其中一个节点是“因（parents）”，另一个是“果（descendants or children）”，两节点就会产生一个条件概率值。比方说，我们以 X i {displaystyle X_{i}} 表示第i个节点，而 X i {displaystyle X_{i}} 的“因”以 P i {displaystyle P_{i}} 表示， X i {displaystyle X_{i}} 的“果”以 C i {displaystyle C_{i}} 表示；图一就是一种典型的贝叶斯网络结构图，依照先前的定义，我们就可以轻易的从图一可以得知：大部分的情况下，贝叶斯网络适用在节点的性质是属于离散型的情况下，且依照 P ( X i | P i ) {displaystyle P(X_{i}|P_{i})} 此条件概率写出条件概率表（conditional probability table, or CPT），此条件概率表的每一行（row）列出所有可能发生的 P i {displaystyle P_{i}} ，每一列（column）列出所有可能发生的 X i {displaystyle X_{i}} ，且任一行的概率总和必为1。写出条件概率表后就很容易将事情给条理化，且轻易地得知此贝叶斯网络结构图中各节点间之因果关系；但是条件概率表也有其缺点：若是节点 X i {displaystyle X_{i}} 是由很多的“因”所造成的“果”，如此条件概率表就会变得在计算上既复杂又使用不便。下图为图一贝叶斯网络中某部分结构图之条件概率表。令 G = (I,E) 表示一个有向无环图（DAG），其中 I 代表图中所有的节点的集合，而 E 代表有向连接线段的集合，且令 X = (Xi)i∈I 为其有向无环图中的某一节点 i 所代表之随机变量，若节点 X 的联合概率分布可以表示成：则称 X 为相对于一有向无环图 G 的贝叶斯网络，其中 p a ( i ) {displaystyle pa(i)} 表示节点 i 之“因”。对任意的随机变量，其联合分布可由各自的局部条件概率分布相乘而得出：依照上式，我们可以将一贝叶斯网络的联合概率分布写成：上面两个表示式之差别在于条件概率的部分，在贝叶斯网络中，若已知其“因”变量下，某些节点会与其“因”变量条件独立，只有与“因”变量有关的节点才会有条件概率的存在。如果联合分布的相依数目很稀少时，使用贝氏函数的方法可以节省相当大的存储器容量。举例而言，若想将10个变量其值皆为0或1存储成一条件概率表型式，一个直观的想法可知我们总共必须要计算 2 10 = 1024 {displaystyle 2^{10}=1024} 个值；但若这10个变量中无任何变量之相关“因”变量是超过三个以上的话，则贝叶斯网络的条件概率表最多只需计算 10 ∗ 2 3 = 80 {displaystyle 10*2^{3}=80} 个值即可。另一个贝式网络优点在于：对人类而言，它更能轻易地得知各变量间是否条件独立或相依与其局部分布（local distribution）的类型来求得所有随机变量之联合分布。定义一个节点之马尔可夫毯为此节点的因节点、果节点与果节点的因节点所成之集合。一旦给定其马尔可夫毯的值后，若网络内之任一节点X皆会与其他的节点条件独立的话，就称X为相对于一有向无环图G的贝叶斯网络。假设有两个服务器 ( S 1 , S 2 ) {displaystyle (S_{1},S_{2})} ，会发送数据包到用户端（以U表示之），但是第二个服务器的数据包发送成功率会与第一个服务器发送成功与否有关，因此此贝叶斯网络的结构图可以表示成如图二的型式。就每个数据包发送而言，只有两种可能值：T（成功）或 F（失败）。则此贝叶斯网络之联合概率分布可以表示成：此模型亦可回答如：“假设已知用户端成功接受到数据包，求第一服务器成功发送数据包的概率?”诸如此类的问题，而此类型问题皆可用条件概率的方法来算出其所求之发生概率：以上例子是一个很简单的贝叶斯网络模型，但是如果当模型很复杂时，这时使用枚举式的方法来求解概率就会变得非常复杂且难以计算，因此必须使用其他的替代方法。一般来说，贝氏概率有以下几种求法：在此，以马尔可夫链蒙特卡洛算法为例，又马尔可夫链蒙特卡洛算法的类型很多，故在这里只说明其中一种吉布斯采样的操作步骤：首先将已给定数值的变量固定，然后将未给定数值的其他变量随意给定一个初始值，接着进入以下迭代步骤：当迭代结丛后，删除前面若干笔尚未稳定的数值，就可以求出的近似条件概率分布。马尔可夫链蒙特卡洛算法的优点是在计算很大的网络时效率很好，但缺点是所抽取出的样本并不具独立性。当贝叶斯网络上的结构跟参数皆已知时，我们可以透过以上方法来求得特定情况的概率，不过，如果当网络的结构或参数未知时，我们必须借由所观测到的数据去推估网络的结构或参数，一般而言，推估网络的结构会比推估节点上的参数来的困难。依照对贝叶斯网络结构的了解和观测值的完整与否，我们可以分成下列四种情形：以下就结构已知的部分，作进一步的说明。此时我们可以用最大似然估计法（MLE）来求得参数。其对数概似函数为其中 p a ( X i ) {displaystyle pa(X_{i})} 代表 X i {displaystyle X_{i}} 的因变量， D i {displaystyle D_{i}} 代表第 1 {displaystyle {mathit {1}}} 个观测值，N代表观测值数据的总数。以图二当例子，我们可以求出节点U的最大似然估计式为由上式就可以借由观测值来估计出节点U的条件分布。如果当模型很复杂时，这时可能就要利用数值分析或其它最优化技巧来求出参数。如果有些节点观测不到的话，可以使用EM算法（Expectation-Maximization algorithm）来决定出参数的区域最佳概似估计式。而EM算法的的主要精神在于如果所有节点的值都已知下，在M阶段就会很简单，如同最大似然估计法。而EM算法的步骤如下：其中 E N ( x ) {displaystyle EN(x)} 代表在当前的估计参数下，事件x的条件概率期望值为让我们考虑一个应用在医药上的概率推论例子，在此病人会被诊断出是否有呼吸困难的症状。表一代表一个我们所观测到的数据集合，包含10笔观测值，S代表的是吸烟与否（Smoker），C代表是否为罹癌者（Cancer），B代表是否罹患支气管炎（bronchitis），D代表是否有呼吸困难及咳嗽（dyspnea and asthma）的症状。‘1’和‘0’分别代表‘是’和‘否’。此医药网络结构显示于图三。表二代表的是整个网络的经验联合概率分布，是由所收集到的数据所建构而成，利用此表可建构出节点的联合概率分布。见图四。此贝氏公式 P ( A | B ) = P ( A , B ) P ( B ) {displaystyle P(A|B)={frac {P(A,B)}{P(B)}}} 可利用节点的边际概率和联合概率去计算节点的条件概率，待会会应用在创建条件概率表格（Conditional probability Table; CPT）上。见图五。贝叶斯网络的联合概率可由下列式子计算：其值见表三。使用整个网络经验联合概率分布所计算出来的值会与使用CPT所计算出来的值不同，其差异可由表二和表三得知。其中差异不只是值的不同，也出现了新事件的概率（原本所没观察到的事件）。创建在观测数据上的概率推论算法：使用表一的观测值和图一的贝叶斯网络结构，并且已知示例点（instantiated node）为 { S = 0 , C = 0 } {displaystyle left{S=0,C=0right}} ，也就是病人为非吸烟者和罹癌者： P ( S = 0 ) = 1 , P ( C = 0 ) = 1 {displaystyle Pleft(S=0right)=1,Pleft(C=0right)=1}问题： 1.病人患有支气管炎的概率 P ( B ) = ? {displaystyle Pleft(Bright)=?} 2.病人会有呼吸困难的概率 P ( D ) = ? {displaystyle Pleft(Dright)=?}解答： 1. P ( B = 0 | S = 0 , C = 0 ) = 0.8 {displaystyle Pleft(B=0|S=0,C=0right)=0.8}2. P ( D = 0 | S = 0 , C = 0 ) {displaystyle Pleft(D=0|S=0,C=0right)}贝叶斯网络当前应用在模拟计算生物学与生物信息学基因调控网络（英语：gene regulatory networks）、蛋白质结构、基因表达分析、医学、文档分类、信息检索、决策支持系统、工程学、数据结合（英语：data fusion）、图像处理等。

相关

明胶明胶又称鱼胶或吉利丁（从英文名“Gelatin”译音而来，音译基准为粤语），是以动物皮、骨内的蛋白质即胶原蛋白制成，带浅黄色透明，无味的胶质，主要成分为蛋白质。明胶通常用于食物、药
行政院主计总处行政院主计总处（简称主计总处）是主管中华民国政府岁计、会计、统计工作的中央二级行政机关，以统计资料作为编制施政计划与预算的依据并为事后的考核，使行政三联制“设计、执行、
埃提乌斯弗拉维乌斯·埃提乌斯（拉丁语：Flavius Aetius，396年－454年），又译阿哀契乌斯，西徐亚裔罗马人，西罗马帝国末期的主要军事统帅。他的主要战绩为在沙隆战役击败匈人入侵，并取得了古代欧洲
电子处方电子处方（英文：electronic prescribing，或者e-prescribing），又称为开具电子处方、开立电子处方、电子处方开立，是指医师利用实时的，病人特异性的临床信息和财务信息，为让病人知情同
双原子碳双原子碳，是高温下碳单质的一种双原子分子存在形式，分子式为C2，在碳蒸汽中存在，可通过电弧制备（同时产生C60），在彗星, 恒星大气层, 和星际物质中，以及蓝色的烃火焰中也存在。尽管价
照相机广义上，照相机是任何可以捕捉和记录影像的设备。最常见的照相机拍摄可见光的影像，但并不是所有照相机都需要可见光（如红外线热像仪），有的甚至不需要一个传统意义上的光源（如扫描隧
马其顿语马其顿语（马其顿语：македонски，罗马化：makedonski，IPA：.mw-parser-output .IPA{font-family:"Charis SIL","Doulos SIL","Linux Libertine","Segoe UI","Lucida Sans Un
阿萨姆语阿萨姆语（Assamiya অসমীয়া）属于印欧语系印度-伊朗语族的印度-雅利安语支，非常接近孟加拉语。是印度东北部阿萨姆邦（Assam）本土居民所使用的语言，也是该邦的官方语言。此语
国立中世纪博物馆国立中世纪博物馆（法语：Musée national du Moyen Âge）是法国首都巴黎的一座博物馆，旧名克鲁尼博物馆（法语：Musée de Cluny）。中世纪博物馆的建筑在过去曾是一座个人官邸，始建于13
扁形虫扁虫动物原本是扁形动物门的同义词，此处是几个门的统称，属于两侧对称动物，也被归类为扁虫动物总门（学名：Platyzoa），但此分类尚未成为共识。本总门包括以下门：扁形动物和腹毛动物没有