边缘概率

✍ dations ◷ 2025-04-04 18:08:41 #边缘概率
本文定义了表征两个或者多个随机变量概率分布特点的术语。条件概率(英语:conditional probability)就是事件A在事件B发生的条件下发生的概率。条件概率表示为P(A|B),读作“A在B发生的条件下发生的概率”。联合概率表示两个事件共同发生的概率。A与B的联合概率表示为 P ( A ∩ B ) {displaystyle P(Acap B)} 或者 P ( A , B ) {displaystyle P(A,B)} 或者 P ( A B ) {displaystyle P(AB)} 。边缘概率是某个事件发生的概率。边缘概率是这样得到的:在联合概率中,把最终结果中不需要的那些事件合并成其事件的全概率而消失(对离散随机变量用求和得全概率,对连续随机变量用积分得全概率)。这称为边缘化(marginalization)。A的边缘概率表示为P(A),B的边缘概率表示为P(B)。需要注意的是,在这些定义中A与B之间不一定有因果或者时间序列关系。A可能会先于B发生,也可能相反,也可能二者同时发生。A可能会导致B的发生,也可能相反,也可能二者之间根本就没有因果关系。例如考虑一些可能是新的信息的概率条件性可以通过贝叶斯定理实现。设 A 与 B 为样本空间 Ω 中的两个事件,其中 P(B)>0。那么在事件 B 发生的条件下,事件 A 发生的条件概率为:条件概率有时候也称为:后验概率。当且仅当两个随机事件A与B满足的时候,它们才是统计独立的,这样联合概率可以表示为各自概率的简单乘积。同样,对于两个独立事件A与B有以及换句话说,如果A与B是相互独立的,那么A在B这个前提下的条件概率就是A自身的概率;同样,B在A的前提下的条件概率就是B自身的概率。当且仅当A与B满足且的时候,A与B是互斥的。因此,换句话说,如果B已经发生,由于A不能和B在同一场合下发生,那么A发生的概率为零;同样,如果A已经发生,那么B发生的概率为零。考虑概率空间Ω(S, σ(S)),其中σ(S)是集S上的σ代数,Ω上对应于随机变量X的概率测度(可以理解为概率分布)为PX;又A∈σ(S),PX(A)≥0(这里可以理解为事件A,A不是零测集)。则∀E∈σ(S),可以定义集函数PX|A如下:PX|A(E)=PX(A∩E)/PX(A)。易知PX|A也是Ω上的概率测度,此测度称为X在A下的条件测度(条件概率分布)。独立性:设A,B∈σ(S),称A,B在概率测度P下为相互独立的,若P(A∩E)=P(A)P(E)。条件概率的谬论是假设P(A|B)大致等于P(B|A)。数学家John Allen Paulos在他的《数学盲》一书中指出医生、律师以及其他受过很好教育的非统计学家经常会犯这样的错误。这种错误可以通过用实数而不是概率来描述数据的方法来避免。P(A|B)与P(B|A)的关系如下所示:下面是一个虚构但写实的例子,P(A|B)与P(B|A)的差距可能令人惊讶,同时也相当明显。若想分辨某些个体是否有重大疾病,以便早期治疗,我们可能会对一大群人进行检验。虽然其益处明显可见,但同时,检验行为有一个地方引起争议,就是有检出假阳性的结果的可能:若有个未得疾病的人,却在初检时被误检为得病,他可能会感到苦恼烦闷,一直持续到更详细的检测显示他并未得病为止。而且就算在告知他其实是健康的人后,也可能因此对他的人生有负面影响。这个问题的重要性,最适合用条件概率的观点来解释。假设人群中有1%的人罹患此疾病,而其他人是健康的。我们随机选出任一个体,并将患病以disease、健康以well表示:假设检验动作实施在未患病的人身上时,有1%的概率其结果为假阳性(阳性以positive表示)。意即:最后,假设检验动作实施在患病的人身上时,有1%的概率其结果为假阴性(阴性以negative表示)。意即:现在,由计算可知:是整群人中健康、且测定为阴性者的比率。是整群人中得病、且测定为阳性者的比率。是整群人中被测定为假阳性者的比率。是整群人中被测定为假阴性者的比率。进一步得出:是整群人中被测出为阳性者的比率。是某人被测出为阳性时,实际上真的得了病的概率。这个例子里面,我们很轻易可以看出P(positive|disease)=99%与P(disease|positive)=50%的差距:前者是你得了病,而被检出为阳性的条件概率;后者是你被检出为阳性,而你实际上真得了病的条件概率。由我们在本例中所选的数字,最终结果可能令人难以接受:被测定为阳性者,其中的半数实际上是假阳性。

相关

  • 密苏里河密苏里河(英语:Missouri River)——美国主要河流之一,北美洲最长河流,在汇入密西西比河前,长3,767公里,流域面积逾130万平方公里。密苏里河发源于蒙大拿州黄石公园附近的落基山脉
  • 上腔静脉上腔静脉(拉丁语:superior vena cava)是一条粗短的静脉干,下端连于右心房上缘,上端由左、右头臂静脉(无名静脉)在右侧第一胸肋结合处的后方汇合而成,垂直下降,在平对第三胸肋关节的下
  • 扁桃扁桃(Prunus dulcis),是梅亚科李属的植物。这种植物原产于波斯,唐朝的《酉阳杂俎》、《岭表录异》对“偏桃木”有所记载。不同于同属李属的李子、樱桃等水果,扁桃主要用作食用的
  • 木星by volume:冰:木星是距离太阳第五近的行星,也是太阳系中体积最大的行星,目前已知有六十余颗卫星。古代的天文学家就已经知道这颗行星 ,罗马人以他们的神称这颗行星为朱庇特。古
  • 迷幻音乐迷幻音乐 是一种音乐流派,有着丰富的流行音乐风格。上世纪60年代兴起了一种叫作迷幻文化的亚文化,人们沉迷于各类迷幻药物,如迷幻剂,迷幻蘑菇,麦司卡林和DMT等,以此引起幻觉,扭曲正
  • LimalokLimalok(原称Harrie或Harriet),是白垩纪—古新世时期成型的海底平顶山,是太平洋东南马绍尔群岛的一座海底山(水下火山)。它可能由今法属波利尼西亚一带的火山热点形成。Limalok坐
  • 能量转换效率能量转换效率是指一个能量转换设备所输出可利用的能量相对其输入能量的比值。输出的可利用能量可能是电能、机械功或是热量。能量转换效率没有一致的定义,主要和输出能量可利
  • 纳米贝纳米贝旧称木萨米迪什,为安哥拉纳米贝省的首府,位于安哥拉西南方,该城建于1840年,人口约132900人,气候干冷,植被以沙漠植物为主。纳米贝建于黑河湾(Bay of Angra do Negro)地区,该地
  • 诺姆诺姆(源自希腊语:Νομός,意为“行政区”;埃及语:Gau)是在公元前3500年左右古埃及前王朝时期最早形成的国家形式。其象形文字是一块被很多水渠分为若干片的土地,很像中国《尔雅
  • 宁德霞浦县黄瓜山贝丘遗址黄瓜山贝丘遗址,位于中国福建省霞浦县沙江镇小马村,为一个省级文物保护单位,类型为古遗址,为第六批福建省文物保护单位,公布时间为2005年5月11日。黄瓜山遗址的历史年代为新石器