首页 >
条件概率
✍ dations ◷ 2025-02-23 16:55:58 #条件概率
本文定义了表征两个或者多个随机变量概率分布特点的术语。条件概率(英语:conditional probability)就是事件A在事件B发生的条件下发生的概率。条件概率表示为P(A|B),读作“A在B发生的条件下发生的概率”。联合概率表示两个事件共同发生的概率。A与B的联合概率表示为
P
(
A
∩
B
)
{displaystyle P(Acap B)}
或者
P
(
A
,
B
)
{displaystyle P(A,B)}
或者
P
(
A
B
)
{displaystyle P(AB)}
。边缘概率是某个事件发生的概率。边缘概率是这样得到的:在联合概率中,把最终结果中不需要的那些事件合并成其事件的全概率而消失(对离散随机变量用求和得全概率,对连续随机变量用积分得全概率)。这称为边缘化(marginalization)。A的边缘概率表示为P(A),B的边缘概率表示为P(B)。需要注意的是,在这些定义中A与B之间不一定有因果或者时间序列关系。A可能会先于B发生,也可能相反,也可能二者同时发生。A可能会导致B的发生,也可能相反,也可能二者之间根本就没有因果关系。例如考虑一些可能是新的信息的概率条件性可以通过贝叶斯定理实现。设 A 与 B 为样本空间 Ω 中的两个事件,其中 P(B)>0。那么在事件 B 发生的条件下,事件 A 发生的条件概率为:条件概率有时候也称为:后验概率。当且仅当两个随机事件A与B满足的时候,它们才是统计独立的,这样联合概率可以表示为各自概率的简单乘积。同样,对于两个独立事件A与B有以及换句话说,如果A与B是相互独立的,那么A在B这个前提下的条件概率就是A自身的概率;同样,B在A的前提下的条件概率就是B自身的概率。当且仅当A与B满足且的时候,A与B是互斥的。因此,换句话说,如果B已经发生,由于A不能和B在同一场合下发生,那么A发生的概率为零;同样,如果A已经发生,那么B发生的概率为零。考虑概率空间Ω(S, σ(S)),其中σ(S)是集S上的σ代数,Ω上对应于随机变量X的概率测度(可以理解为概率分布)为PX;又A∈σ(S),PX(A)≥0(这里可以理解为事件A,A不是零测集)。则∀E∈σ(S),可以定义集函数PX|A如下:PX|A(E)=PX(A∩E)/PX(A)。易知PX|A也是Ω上的概率测度,此测度称为X在A下的条件测度(条件概率分布)。独立性:设A,B∈σ(S),称A,B在概率测度P下为相互独立的,若P(A∩E)=P(A)P(E)。条件概率的谬论是假设P(A|B)大致等于P(B|A)。数学家John Allen Paulos在他的《数学盲》一书中指出医生、律师以及其他受过很好教育的非统计学家经常会犯这样的错误。这种错误可以通过用实数而不是概率来描述数据的方法来避免。P(A|B)与P(B|A)的关系如下所示:下面是一个虚构但写实的例子,P(A|B)与P(B|A)的差距可能令人惊讶,同时也相当明显。若想分辨某些个体是否有重大疾病,以便早期治疗,我们可能会对一大群人进行检验。虽然其益处明显可见,但同时,检验行为有一个地方引起争议,就是有检出假阳性的结果的可能:若有个未得疾病的人,却在初检时被误检为得病,他可能会感到苦恼烦闷,一直持续到更详细的检测显示他并未得病为止。而且就算在告知他其实是健康的人后,也可能因此对他的人生有负面影响。这个问题的重要性,最适合用条件概率的观点来解释。假设人群中有1%的人罹患此疾病,而其他人是健康的。我们随机选出任一个体,并将患病以disease、健康以well表示:假设检验动作实施在未患病的人身上时,有1%的概率其结果为假阳性(阳性以positive表示)。意即:最后,假设检验动作实施在患病的人身上时,有1%的概率其结果为假阴性(阴性以negative表示)。意即:现在,由计算可知:是整群人中健康、且测定为阴性者的比率。是整群人中得病、且测定为阳性者的比率。是整群人中被测定为假阳性者的比率。是整群人中被测定为假阴性者的比率。进一步得出:是整群人中被测出为阳性者的比率。是某人被测出为阳性时,实际上真的得了病的概率。这个例子里面,我们很轻易可以看出P(positive|disease)=99%与P(disease|positive)=50%的差距:前者是你得了病,而被检出为阳性的条件概率;后者是你被检出为阳性,而你实际上真得了病的条件概率。由我们在本例中所选的数字,最终结果可能令人难以接受:被测定为阳性者,其中的半数实际上是假阳性。
相关
- 霍乱霍乱(Cholera)是由霍乱弧菌的某些致病株感染小肠而导致的急性腹泻疾病。症状可能相当轻微,也可能相当严重。典型症状为连续数日严重水泻。可能合并有呕吐、肌肉抽搐的现象 。霍
- 基因拷贝DNA复制是指DNA双链在细胞分裂分裂间期进行的以一个亲代DNA分子为模板合成子代DNA链的过程。复制的结果是一条双链变成两条一样的双链(如果复制过程正常的话),每条双链都与原来
- Hsub2/subTeOsub3/sub亚碲酸是一种碲的含氧酸,化学式为H2TeO3。 人们对这种化合物不太了解。其中一种结构简式为(HO)2TeO。原则上,亚碲酸可以由二氧化碲与水反应制得。它形成的盐却是众所周知的,例
- 柴柴又称为薪,是一种燃料。一般先砍伐树木的主干或枝条,然后把它们劈成适合炉灶大小的条状木材,就是柴。柴是古人日常生活必需品、“开门七件事”“柴米油盐酱醋茶”中排首位;这里
- 王士雄王士雄,字孟英,浙江海宁人,清朝医家,温病学派重要代表人物。居于杭,世为医,咸丰中,杭州陷,转徙上海,当时因战乱,疫病大作,经他治疗的病患,大多全活,名震吴越。他继承了吴又可、叶天士、吴
- EBV病毒人类疱疹病毒第四型(拉丁语:Epstein-Barr virus,缩写EBV、爱泼斯坦-巴尔病毒、 human herpesvirus 4 (HHV-4)),又称为EB病毒,是最常见能引起人类疾病的病毒之一。EBV是在公元1964
- 橘园美术馆坐标:48°51′49.88″N 2°19′20.18″E / 48.8638556°N 2.3222722°E / 48.8638556; 2.3222722橘园美术馆(Musée de l'Orangerie),是一处展示印象派画家及后印象派画作的艺术
- n元语法n元语法(英语:n-gram)指文本中连续出现的n个语词。n元语法模型是基于(n-1)阶马尔可夫链的一种概率语言模型,通过n个语词出现的概率来推断语句的结构。这一模型被广泛应用于概率
- Prins反应Prins反应(Prins reaction)醛或酮与烯烃或炔烃在酸催化下的缩合反应。此反应可用于制取二
- 掠食动物捕食(英语:Predation,或称猎食或掠食)是生态学中一种生物互动方式,在这种方式中,捕食者会捕食其他的生命,而这些被捕食者则称为猎物。在进食或行动的过程里,捕食者不一定会杀死它们