首页 >
似然函数
✍ dations ◷ 2025-09-18 20:32:37 #似然函数
在数理统计学中,似然函数是一种关于统计模型中的参数的函数,表示模型参数中的似然性。似然函数在统计推断中有重大作用,如在最大似然估计和费雪信息之中的应用等等。“似然性”与“或然性”或“概率”意思相近,都是指某种事件发生的可能性,但是在统计学中,“似然性”和“概率”(或然性)又有明确的区分:概率,用于在已知一些参数的情况下,预测接下来在观测上所得到的结果;似然性,则是用于在已知某些观测所得到的结果时,对有关事物之性质的参数进行估值。在这种意义上,似然函数可以理解为条件概率的逆反。在已知某个参数B时,事件A会发生的概率写作:利用贝叶斯定理,因此,我们可以反过来构造表示似然性的方法:已知有事件A发生,运用似然函数
L
(
B
∣
A
)
{displaystyle mathbb {L} (Bmid A)}
,我们估计参数B的可能性。形式上,似然函数也是一种条件概率函数,但我们关注的变量改变了:注意到这里并不要求似然函数满足归一性:
∑
b
∈
B
P
(
A
∣
B
=
b
)
=
1
{displaystyle sum _{bin {mathcal {B}}}P(Amid B=b)=1}
。一个似然函数乘以一个正的常数之后仍然是似然函数。对所有
α
>
0
{displaystyle alpha >0}
,都可以有似然函数:考虑投掷一枚硬币的实验。通常来说,已知掷出一枚“公平的硬币”(正面朝上和反面朝上的概率都为0.5), 即正面(Head)朝上的概率为
p
H
=
0.5
{displaystyle p_{H}=0.5}
,便可以知道投掷若干次后出现各种结果的可能性。比如说,投两次都是正面朝上的概率是0.25。用条件概率表示,就是:其中H表示正面朝上。如果一个硬币的质量分布不够均匀, 那么它可能是一枚"非公平的硬币"在统计学中,我们关心的是在已知一系列投掷的结果时,关于硬币投掷时正面朝上的可能性的信息。
我们可以建立一个统计模型:假设硬币投出时会有
p
H
{displaystyle p_{H}}
的概率正面朝上,而有
1
−
p
H
{displaystyle 1-p_{H}}
的概率反面朝上。
这时,通过观察已发生的两次投掷,条件概率可以改写成似然函数:也就是说,对于取定的似然函数,在观测到两次投掷都是正面朝上时,
p
H
=
0.5
{displaystyle p_{H}=0.5}
的似然性是0.25。注意,反之并不成立,即当似然函数为0.25时不能推论出
p
H
=
0.5
{displaystyle p_{H}=0.5}
。如果考虑
p
H
=
0.6
{displaystyle p_{H}=0.6}
,那么似然函数的值也会改变。如图1所示,注意到似然函数的值变大了。
这说明,如果参数
p
H
{displaystyle p_{H}}
的取值变成0.6的话,结果观测到连续两次正面朝上的概率要比假设
p
H
=
0.5
{displaystyle p_{H}=0.5}
时更大。也就是说,参数
p
H
{displaystyle p_{H}}
取成0.6要比取成0.5更有说服力,更为“合理”。
总之,似然函数的重要性不是它的具体取值,而是当参数变化时函数到底变小还是变大。在这个例子中,如图1所示,似然函数实际上等于:如果取
p
H
=
1
{displaystyle p_{H}=1}
,那么似然函数达到最大值1。也就是说,当连续观测到两次正面朝上时,假设硬币投掷时正面朝上的概率为1是最合理的。类似地,如果观测到的是三次投掷硬币,头两次正面朝上,第三次反面朝上,如图2所示,那么似然函数将会是:这时候,似然函数的最大值将会在
p
H
=
2
3
{displaystyle p_{H}={frac {2}{3}}}
的时候取到。也就是说,当观测到三次投掷中前两次正面朝上而后一次反面朝上时,估计硬币投掷时正面朝上的概率
p
H
=
2
3
{displaystyle p_{H}={frac {2}{3}}}
是最合理的。最大似然估计是似然函数最初也是最自然的应用。上文已经提到,似然函数取得最大值表示相应的参数能够使得统计模型最为合理。从这样一个想法出发,最大似然估计的做法是:首先选取似然函数(一般是概率密度函数或概率质量函数),整理之后求最大值。实际应用中一般会取似然函数的对数作为求最大值的函数,这样求出的最大值和直接求最大值得到的结果是相同的。似然函数的最大值不一定唯一,也不一定存在。与矩法估计比较,最大似然估计的精确度较高,信息损失较少,但计算量较大。似然比检验是利用似然函数来检测某个假设(或限制)是否有效的一种检验。一般情况下,要检测某个附加的参数限制是否是正确的,可以将加入附加限制条件的较复杂模型的似然函数最大值与之前的较简单模型的似然函数最大值进行比较。如果参数限制是正确的,那么加入这样一个参数应当不会造成似然函数最大值的大幅变动。一般使用两者的比例来进行比较,这个比值是卡方分配。尼曼-皮尔森引理说明,似然比检验是所有具有同等显著性差异的检验中最有统计效力的检验。
相关
- 双链DNA病毒脱氧核糖核酸病毒(英语:DNA virus),又称DNA病毒,其遗传物质为DNA。一般为正链DNA病毒。医学导航: 病毒病病毒(蛋白质)/分类cutn/syst (hppv/艾滋病, 流感/疱疹/人畜共患)/人名体
- 音拍音拍(英语:mora)是语言学上以固定长度划分的时间单位,与音节不同。在汉语中,每一个音节的长度几乎是一样的(例如普通话中,“汉”han和“哈”ha长度相同),因此,汉语中可以说音节就是拍
- 毫米汞柱毫米汞柱(英语:Millimeter of mercury),符号为mmHg,是一种压力单位,等于一毫米高的水银柱对液柱底面产生的压力。一毫米汞柱为133.322387415帕斯卡,约为1托。。
- 孢子体孢子体(sporophyte,/spɔːroʊˌfaɪt/)是陆生植物与多细胞藻类世代交替过程中的多细胞二倍体阶段。起始于两个单倍体的配子融合(受精)形成单细胞的二倍体的合子。合子再经过有
- 喷泉喷泉,又称喷水池,传统上指的从源头中向上喷出来的水流,天然的喷泉可以出现于山上或旷野上,有时候甚至会把周围的盘地填满。他们的一个共同点,是拥有足够的水压,当水流离开地面时有
- 大肠埃希菌大肠杆菌(学名:Escherichia coli,通常简写:E. coli)是人和动物肠道中著名的一种细菌,主要寄生于大肠内,约占肠道菌中的0.1%。大肠杆菌是一种两端钝圆、能运动、无芽孢的革兰氏阴性
- DNA夹DNA夹(英语:DNA clamp,又称滑动压板、滑行夹)是一种蛋白质的三级结构,为DNA复制过程中的持续性-启动因子(processivity-promoting factor),是DNA聚合酶III全酶的必要组成,可避免DNA聚
- 神经节细胞层神经节细胞层(神经节层)是视网膜的一层,由视网膜神经节细胞(英语:retinal ganglion cell)以及错位的无长突细胞组成。在黄斑中,这一层分有好几分层。这些细胞呈烧瓶形,其圆形的内侧
- 中心地理论中心地理论(英语:central place theory),出自德国地理学家克里斯塔勒于1933年出版的著作《地图的中心说》中。著作里克里斯塔勒以系统性的科学概念,配以数学计算,旨在解释人类聚落
- 最高领袖伊朗最高领袖(波斯语:مقام رهبری در ایران),又称伊朗革命领袖。该职位不是国家元首或政府首脑,但根据伊朗伊斯兰共和国宪法,是伊朗在宗教上及中央政治的最高领