贝叶斯定理

✍ dations ◷ 2025-12-06 08:50:37 #贝氏定理

贝叶斯定理（英语：Bayes' theorem）是几率论中的一个定理，描述在已知一些条件下，某事件的发生几率。比如，如果已知某癌症与寿命有关，使用贝叶斯定理则可以透过得知某人年龄，来更加准确地计算出他罹患癌症的几率。

通常，事件A在事件B已发生的条件下发生的几率，与事件B在事件A已发生的条件下发生的几率是不一样的。然而，这两者是有确定的关系的，贝叶斯定理就是这种关系的陈述。贝叶斯公式的一个用途，即透过已知的三个几率而推出第四个几率。贝叶斯定理跟随机变量的条件几率以及边缘几率分布有关。

作为一个普遍的原理，贝叶斯定理对于所有几率的解释是有效的。这一定理的主要应用为贝叶斯推断，是推论统计学中的一种推断法。这一定理名称来自于托马斯．貝葉斯。

贝叶斯定理是关于随机事件A和B的条件概率的一则定理。

$P(A\mid B)={\frac {P(B\mid A)P(A)}{P(B)}}$ 发生的条件下事件发生的概率是：

其中与的联合概率表示为 $P(A\cap B)$ 发生的条件下事件发生的概率

整理与合并这两个方程式，我们可以得到

这个引理有时称作概率乘法规则。上式两边同除以P()，若P()是非零的，我们可以得到贝叶斯定理:

贝叶斯定理通常可以再写成下面的形式：

其中是A的补集（即非A）。故上式亦可写成：

在更一般化的情况，假设{}是事件集合里的部分集合，对于任意的，贝叶斯定理可用下式表示：

贝叶斯定理亦可由相似率Λ和可能性表示：

其中

定义为B发生时，A发生的可能性（odds）；

则是A发生的可能性。相似率（Likelihood ratio）则定义为：

贝叶斯定理亦可用于连续几率分布。由于概率密度函数严格上并非几率，由几率密度函数导出贝叶斯定理观念上较为困难（详细推导参阅）。贝叶斯定理与几率密度的关系是由求极限的方式建立：

全几率定理则有类似的论述：

如同离散的情况，公式中的每项均有名称。(, )是和的联合分布；（|）是给定=后，的后验分布；（|）= （|）是=后，的相似度函数（为的函数)；（）和（）则是和的边际分布；（）则是的先验分布。为了方便起见，这里的在这些专有名词中代表不同的函数（可以由引数的不同判断之）。

对于变数有二个以上的情况，贝叶斯定理亦成立。例如：

这个式子可以由套用多次二个变数的贝式定理及条件几率的定义导出：

一般化的方法则是利用联合几率去分解待求的条件几率，并对不加以探讨的变数积分（意即对欲探讨的变数计算边缘几率）。取决于不同的分解形式，可以证明某些积分必为1，因此分解形式可被简化。利用这个性质，贝叶斯定理的计算量可能可以大幅下降。贝氏网络为此方法的一个例子，贝氏网络指定数个变数的联合几率分布的分解型式，该几率分布满足下述条件：当其他变数的条件几率给定时，该变数的条件几率为一简单型式。

下面展示贝叶斯定理在检测吸毒者时的应用。假设一个常规的检测结果的灵敏度和特异度均为99%，即吸毒者每次检测呈阳性（+）的概率为99%。而不吸毒者每次检测呈阴性（-）的概率为99%。从检测结果的概率来看，检测结果是比较准确的，但是贝叶斯定理却可以揭示一个潜在的问题。假设某公司对全体雇员进行吸毒检测，已知0.5%的雇员吸毒。请问每位检测结果呈阳性的雇员吸毒的概率有多高？

令“D”为雇员吸毒事件，“N”为雇员不吸毒事件，“+”为检测呈阳性事件。可得

根据上述描述，我们可以计算某人检测呈阳性时确实吸毒的条件概率P(D|+)：

尽管吸毒检测的准确率高达99%，但贝叶斯定理告诉我们：如果某人检测呈阳性，其吸毒的概率只有大约33%，不吸毒的可能性比较大。假阳性高，则检测的结果不可靠。这是因为该公司不吸毒的人数远远大于吸毒人数，所以即使不吸毒者被误检为阳性的概率仅为1%，其实际被误检人数还是很庞大。举例来说，若该公司总共有1000人（其中5人吸毒，995人不吸），不吸毒的人被检测出阳性的人数有大约10人（1% x 995），而吸毒被验出阳性的人数有5人（99% x 5），总共15人被验出阳性（10 + 5）。在这15人里面，只有约33%的人是真正有吸毒。所以贝叶斯定理可以揭露出此检测在这个案例中的不可靠。

同时，也因为不可靠的主因是不吸毒却被误检阳性的人数远多于吸毒被检测出来的人数（上述例子中10人 > 5 人），所以即使阳性检测灵敏度能到100%（即只要吸毒一定验出阳性），检测结果阳性的员工，真正吸毒的概率 $P(D|+)$ $P(D|+)$ 也只会提高到约33.4%。但如果灵敏度仍然是99%，而特异度却提高到99.5%（即不吸毒的人中，约0.5%会被误检为阳性），则检测结果阳性的员工，真正吸毒的概率可以提高到49.9%。

基于贝叶斯定理：即使100%的胰腺癌症患者都有某症状，而某人有同样的症状，绝对不代表该人有100%的概率得胰腺癌，还需要考虑先验概率，假设胰腺癌的发病率是十万分之一，而全球有同样症状的人有万分之一，则此人得胰腺癌的概率只有十分之一，90%的可能是是假阳性。

基于贝叶斯定理：假设100%的不良种子都表现A性状，而种子表现A性状，并不代表此种子100%是不良种子，还需要考虑先验概率，假设一共有6万颗不良种子，在种子中的比例是十万分之一（假设总共有60亿颗种子），假设所有种子中有1/3表现A性状（即20亿颗种子表现A性状），则此种子为不良种子的概率只有十万分之三。

相关

利什曼原虫L. aethiopica L. amazonensis L. arabica L. archibaldi (disputed species) L. aristedesi L. (Viannia) braziliensis L. chagasi (syn. L. infantum) L. (Viannia) colo
化学核化学（英语：Nuclear chemistry，又称为核子化学）是研究原子核（稳定性和放射性）的反应、性质、结构、分离、鉴定等的一门学科。例如，研究不同的次原子粒子怎样共同形成一个原子核以
屠呦呦中华人民共和国全国科学大会奖（1978）中华人民共和国国家发明奖二等奖（1979）世界文化理事会阿尔伯特·爱因斯坦世界科学奖（1987）第三届中国中医科学院唐氏中药发展奖（2009）葛兰
弗朗索瓦·恩格勒弗朗索瓦·恩格勒（法语：François Englert，1932年11月6日－），比利时理论物理学家，在粒子物理学做出重要贡献。1964年，恩格勒和罗伯特·布绕特共同提出希格斯机制与希格斯玻色子理论。
胃部胃是人和脊椎动物消化系统的一部分，是贮藏和消化食物的器官。胃上接食道，下接十二指肠。位置大约位于人体的左上腹，肋骨以下。胃主要将大块食物研磨成小块，将食物中的大分子降解
新光银行台湾新光商业银行股份有限公司，简称：“新光银行”、“新光商银”、“新光银”、“SKBank”、“SKCB”，为台湾的商业银行之一，全台湾分行家数达105家。前身为诚泰商业银行与联信
ARP地址解析协议（英语：Address Resolution Protocol，缩写：ARP）是一个通过解析网络层地址来找寻数据链路层地址的网络传输协议，它在IPv4中极其重要。ARP最初在1982年的RFC 826（征求意
赤崎勇赤崎勇（日语：赤﨑勇／あかさきいさむ Akasaki Isamu ?，1929年1月30日－），日本化学工程学家，曾任松下电器研究员，现任名城大学终身教授、名古屋大学特别教授及名誉教授。美国国家工程
不屈法国不屈法国（法语：La France insoumise，缩写为FI）是法国的一个左翼至极左翼的政党。2016年2月10日，法国左翼政治家让-吕克·梅朗雄为参加2017年法国总统选举而创建该党，以整合支持他
莱克县莱克县（Lake County, Colorado）是位于美国科罗拉多州中部的一个县。面积994平方公里。根据美国2000年人口普查，共有人口7,812人。县治莱德维尔 (Leadville)。阿肯色河—密西西