连续概率

✍ dations ◷ 2025-07-11 16:44:19 #连续概率
概率分布(德语:Wahrscheinlichkeitsverteilung;英语:probability distribution)或简称分布,是概率论的一个概念。使用时可以有以下两种含义:称X和Y为同分布的随机变量,当且仅当对任意事件 A ∈ F {displaystyle Ain {mathcal {F}}} ,有 P ( X ∈ A ) = P ( Y ∈ A ) {displaystyle mathbb {P} (Xin A)=mathbb {P} (Yin A)} 成立。但是,不能认为同分布的随机变量是相同的随机变量。事实上即使X与Y同分布,也可以没有任何点ω使得X(ω)=Y(ω)。在这个意义下,可以把随机变量分类,每一类称作一个分布,其中的所有随机变量都同分布。用更简要的语言来说,同分布是一种等价关系,每一个等价类就是一个分布。需注意的是,通常谈到的离散分布、均匀分布、伯努利分布、正态分布、泊松分布等,都是指各种类型的分布,而不能视作一个分布。F X ( a ) = P ( X ≤ a ) {displaystyle F_{X}(a)=mathbb {P} (Xleq a)} ,对任意实数 a {displaystyle a} 定义。具有相同分布函数的随机变量一定是同分布的,因此可以用分布函数来描述一个分布,但更常用的描述手段是概率密度函数(德语:Wahrscheinlichkeitsdichtefunktion,英语:probability density function, pdf)。对于特定的随机变量 X {displaystyle X} ,其分布函数 F X {displaystyle F_{X}} 是单调不减及右连续,而且 F X ( − ∞ ) = 0 {displaystyle F_{X}(-infty )=0} , F X ( ∞ ) = 1 {displaystyle F_{X}(infty )=1} 。这些性质反过来也描述了所有可能成为分布函数的函数:设 P {displaystyle P} 为概率测度, X {displaystyle X} 为随机变量,则函数 F ( x ) = P ( X ≤ x ) , ( x ∈ R ) {displaystyle F(x)=P(Xleq x),(xin mathbb {R} )} 称为 X {displaystyle X} 的概率分布函数。如果将 X {displaystyle X} 看成是数轴上的随机点的坐标,那么,分布函数 F ( x ) {displaystyle F(x)} 在 x {displaystyle x} 处的函数值就表示 X {displaystyle X} 落在区间 ( − ∞ , x ] {displaystyle (-infty ,x]} 上的概率。例如,设随机变量 X {displaystyle X} 为掷两次骰子所得的点数差,而整个样本空间由 36 个元素组成。其分布函数是:上面所列举的例子属于离散分布,即分布函数的值域是离散的,比如只取整数值的随机变量就是属于离散分布的。 F ( x ) {displaystyle F(x)} 表示随机变量 X ≤ x {displaystyle Xleq x} 的概率值。如果X的取值只有 x 1 < x 2 < . . . < x n {displaystyle x_{1}<x_{2}<...<x_{n}} ,则:二项分布是最重要的离散概率分布之一,由瑞士数学家雅各布·伯努利(Jakob Bernoulli)所发展,一般用二项分布来计算概率的前提是,每次抽出样品后再放回去,并且只能有两种试验结果,比如黑球或红球,正品或次品等。二项分布指出,随机一次试验出现的概率如果为 p {displaystyle p} ,那么在 n {displaystyle n} 次试验中出现 k {displaystyle k} 次的概率为:例如,在掷3次骰子中,不出现6点的概率是: f ( 3 , 0 , 1 6 ) = ( 3 0 ) ( 1 6 ) 0 ( 5 6 ) 3 = 0.579 {displaystyle f(3,0,{frac {1}{6}})={3 choose 0}left({frac {1}{6}}right)^{0}left({frac {5}{6}}right)^{3}=0.579} 在连续两次的轮盘游戏中,至少出现一次红色的概率为: f ( 2 , 1 , 18 37 ) + f ( 2 , 2 , 18 37 ) = 0.736 {displaystyle f(2,1,{frac {18}{37}})+f(2,2,{frac {18}{37}})=0.736}二项分布在 p = 0.5 {displaystyle p=0.5} 时表现出图像的对称性,而在 p {displaystyle p} 取其它值时是非对称的。另外二项分布的期望值 E ⁡ ( X ) = n p {displaystyle operatorname {E} (X)=np} ,以及方差 var ⁡ ( X ) = n p ( 1 − p ) {displaystyle operatorname {var} (X)=n,p,(1-p)!}作为离散概率分布的超几何分布尤其指在抽样试验时抽出的样品不再放回去的分布情况。在一个容器中一共有 N {displaystyle N} 个球,其中 M {displaystyle M} 个黑球, ( N − M ) {displaystyle (N-M)} 个红球,通过下面的超几何分布公式可以计算出,从容器中抽出的 n {displaystyle n} 个球中(抽出的球不放回去)有 k {displaystyle k} 个黑球的概率是多少:例如,容器中一共10个球,其中6个黑色,4个白色,一共抽5次(抽出的球不放回去),在这5个球中有3个黑球的概率是: f ( k = 3 ) = ( 6 3 ) ( 10 − 6 5 − 3 ) ( 10 5 ) = 0.476 {displaystyle f(k=3)={frac {displaystyle {6 choose 3}{10-6 choose 5-3}}{displaystyle {10 choose 5}}}=0.476}和二项分布不同的是,在超几何分布中,特别强调的是抽出的样品在下一次抽取前不再放回去,但是如果抽取的次数 n {displaystyle n} 和总共样品数 N {displaystyle N} 相比很小(大约 n / N < 0 , 05 {displaystyle n/N<0,05} ),这时在计算上二项分布和超几何分布相互间则没有主要的区别,此时人们更愿意采用二项分布的方法,因为在数学计算上二项分布要简单一些。泊松近似是二项分布的一种极限形式。其强调如下的试验前提:一次抽样的概率值 p {displaystyle p} 相对很小,而抽取次数 n {displaystyle n} 值又相对很大。因此泊松分布又被称之为罕有事件分布。泊松分布指出,如果随机一次试验出现的概率为 p {displaystyle p} ,那么在 n {displaystyle n} 次试验中出现 k {displaystyle k} 次的概率按照泊松分布应该为:其中,数学常数 e = 2.71828... {displaystyle e=2.71828...} (自然对数的底数)例如,某工厂在生产零件时,每200个成品中会有1个次品,那么在100个零件中最多出现2个次品的概率按照泊松分布应该是: f ( 100 , 0 , 1 200 ) + f ( 100 , 1 , 1 200 ) + f ( 100 , 2 , 1 200 ) = 0.986 {displaystyle f(100,0,{frac {1}{200}})+f(100,1,{frac {1}{200}})+f(100,2,{frac {1}{200}})=0.986}在实践中如果遇到 n {displaystyle n} 值很大导致二项分布难于计算时,可以考虑使用泊松分布,但前提是 n ⋅ p {displaystyle ncdot p} 必须趋于一个有限极限。采用泊松分布的一个不太严格的规则(通过展开二项分布,并在形式上化简为类似泊松分布后,利用极限化简即可得)是:设 X {displaystyle X} 是具有分布函数 F {displaystyle F} 的连续随机变量,且F的一阶导数处处存在,则其导函数称为 X {displaystyle X} 的概率密度函数。每个概率密度函数都有如下性质:第一个性质表明,概率密度函数与 x {displaystyle x} 轴形成的区域的面积等于1,第二个性质表明,连续随机变量在区间 [ a , b ] {displaystyle } 的概率值等于密度函数在区间 [ a , b ] {displaystyle } 上的积分,也即是与 X {displaystyle X} 轴在 [ a , b ] {displaystyle } 内形成的区域的面积。因为 0 ≤ F ( x ) ≤ 1 {displaystyle 0leq F(x)leq 1} ,且 f ( x ) {displaystyle f(x)} 是 F ( x ) {displaystyle F(x)} 的导数,因此按照积分原理不难推出上面两个公式。正态分布、指数分布、 t {displaystyle t} -分布, F {displaystyle F} -分布以及 Ξ 2 {displaystyle Xi ^{2}} -分布都是连续分布。连续随机变量的概率密度函数如果是如下形式,那么这个连续分布被称之为正态分布,或者高斯分布。其密度函数的曲线呈对称钟形,因此又被称之为钟形曲线,其中 μ {displaystyle mu } 是平均值, σ {displaystyle sigma } 是标准差。正态分布是一种理想分布,许多典型的分布,比如成年人的身高,汽车轮胎的运转状态,人类的智商值(IQ),都属于或者说至少接近正态分布。同样按照连续分布的定义,常态概率密度函数具有和普通概率密度函数类似的性质:如果给出一个正态分布的平均值 μ {displaystyle mu } 以及标准差 σ {displaystyle sigma } ,可以根据上面的第二个公式计算出任一区间的概率分布情况。但是如上的计算量是相当庞大的,没有计算机的辅助基本是不可能的,解决这一问题的方法是借助 z {displaystyle z} -变换以及标准正态分布表格( z {displaystyle z} -表格)。中间值 μ = 0 {displaystyle mu =0} 以及标准差 σ = 1 {displaystyle sigma =1} 的正态分布被称之为标准正态分布,其累积分布函数是将普通形式的正态分布变换到标准正态分布的方法是例如,已知一正态分布的 μ = 5 {displaystyle mu =5} , σ = 3 {displaystyle sigma =3} ,求区间概率值 P ( 4 < X ≤ 7 ) ? {displaystyle P(4<Xleq 7)?} 计算过程如下,其中 Φ ( z ) {displaystyle Phi (z)} 值通过查 z {displaystyle z} -表格获得。在离散分布中如果试验次数 n {displaystyle n} 值非常大,而且单次试验的概率 p {displaystyle p} 值又不是很小的情况下,正态分布可以用来近似的代替二项分布。一个粗略的使用正态分布的近似规则是: n ⋅ p ⋅ ( 1 − p ) ≥ 9 {displaystyle ncdot pcdot (1-p)geq 9} 。从二项分布中获得 μ {displaystyle mu } 和 σ {displaystyle sigma } 值的方法是如果 σ > 3 {displaystyle sigma >3} ,则必须采用下面的近似修正方法:(注: q = 1 − p {displaystyle q=1-p} ;EF:二项分布;ZF:正态分布)上(下)临界值分别增加(减少)修正值0.5的目的是在 σ {displaystyle sigma } 值很大时获得更精确的近似值,只有 σ {displaystyle sigma } 很小时,修正值0.5可以不被考虑。例如,随机试验为连续64次掷硬币,获得的国徽数位于32和42之间的概率是多少?用正态分布计算如下,n ⋅ p ⋅ q = 16 ≥ 9 {displaystyle ncdot pcdot q=16geq 9} ,符合近似规则,应用 z {displaystyle z} -变换:在运用 z {displaystyle z} -表格时注意到利用密度函数的对称性来求出 z {displaystyle z} 为负值时的区域面积。

相关

  • 刺胞动物门刺胞动物门(拉丁学名:Cnidaria;/naɪˈdɛəriə/),旧名腔肠动物门,又名刺丝胞动物门、刺细胞动物门,是一个包含有超过2万多个动物物种的门 ,皆为生活于水中(包括淡、海水或其他咸水
  • 斯普利特斯普利特(克罗地亚语:Split),是一座位于地中海畔、亚得里亚海东岸的克罗地亚南部港市。市内人口约有18万(2001年调查),是达尔马提亚地区最大都市,也是克罗地亚第二大城。同时,斯普利
  • 词干在语言学中,词干(stem),或语干,是词的一部分。在不同情况下使用,其含义有差异。词干的其中一种含义,是指词缀所附着的部分。 例如在英语单词friendships中包含了词干friend,词缀-shi
  • 马雅语系玛雅语系(或玛雅语族)是一支使用于墨西哥东南一直到中美洲北部的语族,最远到达洪都拉斯,最早可追溯到五百年前前哥伦布时期的中部美洲(包括中美洲与墨西哥),虽然现今这些地区的官方
  • 性商店成人用品店,又有性商店、情趣用品店、性用品店、性保健用品店、色情用品商店等名称,是一种销售性玩具、情趣内衣、避孕套、BDSM用具、春药等商品的商店,有的成人用品店还经销成
  • 沃尔夫冈·苛勒沃尔夫冈·苛勒(Wolfgang Köhler,1887年1月21日-1967年6月11日)是一位德国格式塔心理学家。1887年1月21日,沃尔夫冈·苛勒出生在爱沙尼亚塔林,后来在德国的沃尔芬布特尔长大。190
  • 键矩键偶极矩是衡量化学键的极性大小的物理量,表示为键矩是向量,方向从正指向负。 键矩单位是德拜(D,Debye)或库仑·米(C‧m) 1D= 3.336X10-30C‧m
  • ClF一氟化氯,为氯的氟化物,分子式为ClF。室温下为无色气体。一氟化氯热稳定性很高,即使在高温下,一氟化氯也不易分解。一氟化氯熔点-155.6℃,沸点-100.8℃.化学性质极为活泼。
  • 胸大肌胸大肌为将手臂拉向胸部的肌肉,两块胸大肌位于胸的两侧。胸大肌通常称为胸肌或胸脯,成扇型,且分裂为大小不等两部分。在其窄端,两部分都附着于肱骨之上,在宽的一端,较小的部分附于
  • 土耳其咖啡土耳其咖啡(土耳其语:Türk kahvesi)是一种拥有漫长历史的咖啡饮品,将研磨到细致成粉的咖啡豆放进咖啡壶内,与热水烹煮成味道浓烈的咖啡。土耳其咖啡的冲调手法并非土耳其仅有,在