首页 >
贝氏网络
✍ dations ◷ 2025-07-11 16:23:52 #贝氏网络
贝叶斯网络(Bayesian network),又称信念网络(belief network)或是有向无环图模型(directed acyclic graphical model),是一种概率图型模型,借由有向无环图(directed acyclic graphs, or DAGs)中得知一组随机变量
{
X
1
,
X
2
,
.
.
.
,
X
n
}
{displaystyle left{X_{1},X_{2},...,X_{n}right}}
及其n组条件概率分布(conditional probability distributions, or CPDs)的性质。举例而言,贝叶斯网络可用来表示疾病和其相关症状间的概率关系;倘若已知某种症状下,贝叶斯网络就可用来计算各种可能罹患疾病之发生概率。一般而言,贝叶斯网络的有向无环图中的节点表示随机变量,它们可以是可观察到的变量,抑或是隐变量、未知参数等。连接两个节点的箭头代表此两个随机变量是具有因果关系或是非条件独立的;而两个节点间若没有箭头相互连接一起的情况就称其随机变量彼此间为条件独立。若两个节点间以一个单箭头连接在一起,表示其中一个节点是“因(parents)”,另一个是“果(descendants or children)”,两节点就会产生一个条件概率值。比方说,我们以
X
i
{displaystyle X_{i}}
表示第i个节点,而
X
i
{displaystyle X_{i}}
的“因”以
P
i
{displaystyle P_{i}}
表示,
X
i
{displaystyle X_{i}}
的“果”以
C
i
{displaystyle C_{i}}
表示;图一就是一种典型的贝叶斯网络结构图,依照先前的定义,我们就可以轻易的从图一可以得知:大部分的情况下,贝叶斯网络适用在节点的性质是属于离散型的情况下,且依照
P
(
X
i
|
P
i
)
{displaystyle P(X_{i}|P_{i})}
此条件概率写出条件概率表(conditional probability table, or CPT),此条件概率表的每一行(row)列出所有可能发生的
P
i
{displaystyle P_{i}}
,每一列(column)列出所有可能发生的
X
i
{displaystyle X_{i}}
,且任一行的概率总和必为1。写出条件概率表后就很容易将事情给条理化,且轻易地得知此贝叶斯网络结构图中各节点间之因果关系;但是条件概率表也有其缺点:若是节点
X
i
{displaystyle X_{i}}
是由很多的“因”所造成的“果”,如此条件概率表就会变得在计算上既复杂又使用不便。下图为图一贝叶斯网络中某部分结构图之条件概率表。令 G = (I,E) 表示一个有向无环图(DAG),其中 I 代表图中所有的节点的集合,而 E 代表有向连接线段的集合,且令 X = (Xi)i∈I 为其有向无环图中的某一节点 i 所代表之随机变量,若节点 X 的联合概率分布可以表示成:则称 X 为相对于一有向无环图 G 的贝叶斯网络,其中
p
a
(
i
)
{displaystyle pa(i)}
表示节点 i 之“因”。对任意的随机变量,其联合分布可由各自的局部条件概率分布相乘而得出:依照上式,我们可以将一贝叶斯网络的联合概率分布写成:上面两个表示式之差别在于条件概率的部分,在贝叶斯网络中,若已知其“因”变量下,某些节点会与其“因”变量条件独立,只有与“因”变量有关的节点才会有条件概率的存在。如果联合分布的相依数目很稀少时,使用贝氏函数的方法可以节省相当大的存储器容量。举例而言,若想将10个变量其值皆为0或1存储成一条件概率表型式,一个直观的想法可知我们总共必须要计算
2
10
=
1024
{displaystyle 2^{10}=1024}
个值;但若这10个变量中无任何变量之相关“因”变量是超过三个以上的话,则贝叶斯网络的条件概率表最多只需计算
10
∗
2
3
=
80
{displaystyle 10*2^{3}=80}
个值即可。另一个贝式网络优点在于:对人类而言,它更能轻易地得知各变量间是否条件独立或相依与其局部分布(local distribution)的类型来求得所有随机变量之联合分布。定义一个节点之马尔可夫毯为此节点的因节点、果节点与果节点的因节点所成之集合。一旦给定其马尔可夫毯的值后,若网络内之任一节点X皆会与其他的节点条件独立的话,就称X为相对于一有向无环图G的贝叶斯网络。假设有两个服务器
(
S
1
,
S
2
)
{displaystyle (S_{1},S_{2})}
,会发送数据包到用户端(以U表示之),但是第二个服务器的数据包发送成功率会与第一个服务器发送成功与否有关,因此此贝叶斯网络的结构图可以表示成如图二的型式。就每个数据包发送而言,只有两种可能值:T(成功)或 F(失败)。则此贝叶斯网络之联合概率分布可以表示成:此模型亦可回答如:“假设已知用户端成功接受到数据包,求第一服务器成功发送数据包的概率?”诸如此类的问题,而此类型问题皆可用条件概率的方法来算出其所求之发生概率:以上例子是一个很简单的贝叶斯网络模型,但是如果当模型很复杂时,这时使用枚举式的方法来求解概率就会变得非常复杂且难以计算,因此必须使用其他的替代方法。一般来说,贝氏概率有以下几种求法:在此,以马尔可夫链蒙特卡洛算法为例,又马尔可夫链蒙特卡洛算法的类型很多,故在这里只说明其中一种吉布斯采样的操作步骤:
首先将已给定数值的变量固定,然后将未给定数值的其他变量随意给定一个初始值,接着进入以下迭代步骤:当迭代结丛后,删除前面若干笔尚未稳定的数值,就可以求出的近似条件概率分布。马尔可夫链蒙特卡洛算法的优点是在计算很大的网络时效率很好,但缺点是所抽取出的样本并不具独立性。当贝叶斯网络上的结构跟参数皆已知时,我们可以透过以上方法来求得特定情况的概率,不过,如果当网络的结构或参数未知时,我们必须借由所观测到的数据去推估网络的结构或参数,一般而言,推估网络的结构会比推估节点上的参数来的困难。依照对贝叶斯网络结构的了解和观测值的完整与否,我们可以分成下列四种情形:以下就结构已知的部分,作进一步的说明。此时我们可以用最大似然估计法(MLE)来求得参数。其对数概似函数为其中
p
a
(
X
i
)
{displaystyle pa(X_{i})}
代表
X
i
{displaystyle X_{i}}
的因变量,
D
i
{displaystyle D_{i}}
代表第
1
{displaystyle {mathit {1}}}
个观测值,N代表观测值数据的总数。以图二当例子,我们可以求出节点U的最大似然估计式为由上式就可以借由观测值来估计出节点U的条件分布。如果当模型很复杂时,这时可能就要利用数值分析或其它最优化技巧来求出参数。如果有些节点观测不到的话,可以使用EM算法(Expectation-Maximization algorithm)来决定出参数的区域最佳概似估计式。而EM算法的的主要精神在于如果所有节点的值都已知下,在M阶段就会很简单,如同最大似然估计法。而EM算法的步骤如下:其中
E
N
(
x
)
{displaystyle EN(x)}
代表在当前的估计参数下,事件x的条件概率期望值为让我们考虑一个应用在医药上的概率推论例子,在此病人会被诊断出是否有呼吸困难的症状。表一代表一个我们所观测到的数据集合,包含10笔观测值,S代表的是吸烟与否(Smoker),C代表是否为罹癌者(Cancer),B代表是否罹患支气管炎(bronchitis),D代表是否有呼吸困难及咳嗽(dyspnea and asthma)的症状。‘1’和‘0’分别代表‘是’和‘否’。此医药网络结构显示于图三。表二代表的是整个网络的经验联合概率分布,是由所收集到的数据所建构而成,利用此表可建构出节点的联合概率分布。见图四。此贝氏公式
P
(
A
|
B
)
=
P
(
A
,
B
)
P
(
B
)
{displaystyle P(A|B)={frac {P(A,B)}{P(B)}}}
可利用节点的边际概率和联合概率去计算节点的条件概率,待会会应用在创建条件概率表格(Conditional probability Table; CPT)上。见图五。贝叶斯网络的联合概率可由下列式子计算:其值见表三。使用整个网络经验联合概率分布所计算出来的值会与使用CPT所计算出来的值不同,其差异可由表二和表三得知。其中差异不只是值的不同,也出现了新事件的概率(原本所没观察到的事件)。创建在观测数据上的概率推论算法:使用表一的观测值和图一的贝叶斯网络结构,并且已知示例点(instantiated node)为
{
S
=
0
,
C
=
0
}
{displaystyle left{S=0,C=0right}}
,也就是病人为非吸烟者和罹癌者:
P
(
S
=
0
)
=
1
,
P
(
C
=
0
)
=
1
{displaystyle Pleft(S=0right)=1,Pleft(C=0right)=1}问题:
1.病人患有支气管炎的概率
P
(
B
)
=
?
{displaystyle Pleft(Bright)=?}
2.病人会有呼吸困难的概率
P
(
D
)
=
?
{displaystyle Pleft(Dright)=?}解答:
1.
P
(
B
=
0
|
S
=
0
,
C
=
0
)
=
0.8
{displaystyle Pleft(B=0|S=0,C=0right)=0.8}2.
P
(
D
=
0
|
S
=
0
,
C
=
0
)
{displaystyle Pleft(D=0|S=0,C=0right)}贝叶斯网络当前应用在模拟计算生物学与生物信息学基因调控网络(英语:gene regulatory networks)、蛋白质结构、基因表达分析、医学、文档分类、信息检索、决策支持系统、工程学、数据结合(英语:data fusion)、图像处理等。
相关
- 马斯河谷事件马斯河谷事件(也称马斯河谷烟雾事件或1930年马斯河谷烟雾事件),是指1930年12月1日—12月5日发生在比利时马斯河谷工业区的大气污染事件。马斯河谷地区大量工业排放的二氧化硫、
- 结构域蛋白质结构域(英语:protein domain)是蛋白质中的一类结构单元,是构成蛋白质(三级)结构的基本单元。有些球形蛋白的一条肽链,或以共价键相连的两条或多条肽链在空间结构上可以区分为
- 放射生物学放射生物学(英语:Radiobiology)或称放射线生物学(radiation biology)是一门跨领域学科,专门研究游离辐射与非游离辐射在生物学上的效应。
- 渐br /新br /世渐新世(Oligocene)是地质时代中古近纪的最后一个主要分期,大约开始于3400万年前,终于2300万年前,介于始新世(Eocene)与新近纪的中新世(Miocene)之间。比起其他比较古老的地质时期,用岩
- 小眼小眼(Ommatidia),是复眼的组成部分,是一个细小的独立感光组织,能够分辨光暗及颜色。一个小眼由以下部分组成:其中角膜和晶体圆锥的作用相当于透镜。视网膜细胞带微绒毛的一侧(8个感
- 虾黄赤蜻虾黄赤蜻(学名:Sympetrum flaveolum),又名黄翅赤蜻,是分布在欧洲及中国中及北部的蜻蜓。它们只在死水中繁殖,尤其是在泥煤沼。它们虽然并非住在英国,但有些有时会迁徙至此。于1906
- 火腿火腿(英语:Ham),是经过盐渍、烟熏、发酵和干燥处理的腌制动物后腿,一般用猪后腿。或是以猪、牛肉的肉泥,添加淀粉与食品添加剂,压制而成的“三明治火腿”。营养成分主要为蛋白质、
- 欲欲望一词专指五官之欲,尤指情慾。马斯洛需求层次理论是人本主义科学的理论之一,由美国心理学家亚伯拉罕·马斯洛在1943年在《人类激励理论》论文中所提出。书中将人类需求像阶
- 多伦试液银氨溶液(英语:Tollens' reagent),也称氢氧化四氨合银、苛性银、多伦试剂、吐伦试剂、土伦试剂,指含有二氨合银(I)离子(+)的水溶液,一般由硝酸银或其他银化合物与氨水反应制取,用作银
- 格尔津文化第八第十格尔津文化(英语:Gerzeh culture),埃及前王朝时期的历史文化阶段(约公元前3500年至公元前3200年前后),即奈加代二期文化。位于今埃及南部的奈加代、希拉孔波利斯以及努比亚