似然函数

✍ dations ◷ 2025-10-30 08:19:23 #似然函数
在数理统计学中,似然函数是一种关于统计模型中的参数的函数,表示模型参数中的似然性。似然函数在统计推断中有重大作用,如在最大似然估计和费雪信息之中的应用等等。“似然性”与“或然性”或“概率”意思相近,都是指某种事件发生的可能性,但是在统计学中,“似然性”和“概率”(或然性)又有明确的区分:概率,用于在已知一些参数的情况下,预测接下来在观测上所得到的结果;似然性,则是用于在已知某些观测所得到的结果时,对有关事物之性质的参数进行估值。在这种意义上,似然函数可以理解为条件概率的逆反。在已知某个参数B时,事件A会发生的概率写作:利用贝叶斯定理,因此,我们可以反过来构造表示似然性的方法:已知有事件A发生,运用似然函数 L ( B ∣ A ) {displaystyle mathbb {L} (Bmid A)} ,我们估计参数B的可能性。形式上,似然函数也是一种条件概率函数,但我们关注的变量改变了:注意到这里并不要求似然函数满足归一性: ∑ b ∈ B P ( A ∣ B = b ) = 1 {displaystyle sum _{bin {mathcal {B}}}P(Amid B=b)=1} 。一个似然函数乘以一个正的常数之后仍然是似然函数。对所有 α > 0 {displaystyle alpha >0} ,都可以有似然函数:考虑投掷一枚硬币的实验。通常来说,已知掷出一枚“公平的硬币”(正面朝上和反面朝上的概率都为0.5), 即正面(Head)朝上的概率为 p H = 0.5 {displaystyle p_{H}=0.5} ,便可以知道投掷若干次后出现各种结果的可能性。比如说,投两次都是正面朝上的概率是0.25。用条件概率表示,就是:其中H表示正面朝上。如果一个硬币的质量分布不够均匀, 那么它可能是一枚"非公平的硬币"在统计学中,我们关心的是在已知一系列投掷的结果时,关于硬币投掷时正面朝上的可能性的信息。 我们可以建立一个统计模型:假设硬币投出时会有 p H {displaystyle p_{H}} 的概率正面朝上,而有 1 − p H {displaystyle 1-p_{H}} 的概率反面朝上。 这时,通过观察已发生的两次投掷,条件概率可以改写成似然函数:也就是说,对于取定的似然函数,在观测到两次投掷都是正面朝上时, p H = 0.5 {displaystyle p_{H}=0.5} 的似然性是0.25。注意,反之并不成立,即当似然函数为0.25时不能推论出 p H = 0.5 {displaystyle p_{H}=0.5} 。如果考虑 p H = 0.6 {displaystyle p_{H}=0.6} ,那么似然函数的值也会改变。如图1所示,注意到似然函数的值变大了。 这说明,如果参数 p H {displaystyle p_{H}} 的取值变成0.6的话,结果观测到连续两次正面朝上的概率要比假设 p H = 0.5 {displaystyle p_{H}=0.5} 时更大。也就是说,参数 p H {displaystyle p_{H}} 取成0.6要比取成0.5更有说服力,更为“合理”。 总之,似然函数的重要性不是它的具体取值,而是当参数变化时函数到底变小还是变大。在这个例子中,如图1所示,似然函数实际上等于:如果取 p H = 1 {displaystyle p_{H}=1} ,那么似然函数达到最大值1。也就是说,当连续观测到两次正面朝上时,假设硬币投掷时正面朝上的概率为1是最合理的。类似地,如果观测到的是三次投掷硬币,头两次正面朝上,第三次反面朝上,如图2所示,那么似然函数将会是:这时候,似然函数的最大值将会在 p H = 2 3 {displaystyle p_{H}={frac {2}{3}}} 的时候取到。也就是说,当观测到三次投掷中前两次正面朝上而后一次反面朝上时,估计硬币投掷时正面朝上的概率 p H = 2 3 {displaystyle p_{H}={frac {2}{3}}} 是最合理的。最大似然估计是似然函数最初也是最自然的应用。上文已经提到,似然函数取得最大值表示相应的参数能够使得统计模型最为合理。从这样一个想法出发,最大似然估计的做法是:首先选取似然函数(一般是概率密度函数或概率质量函数),整理之后求最大值。实际应用中一般会取似然函数的对数作为求最大值的函数,这样求出的最大值和直接求最大值得到的结果是相同的。似然函数的最大值不一定唯一,也不一定存在。与矩法估计比较,最大似然估计的精确度较高,信息损失较少,但计算量较大。似然比检验是利用似然函数来检测某个假设(或限制)是否有效的一种检验。一般情况下,要检测某个附加的参数限制是否是正确的,可以将加入附加限制条件的较复杂模型的似然函数最大值与之前的较简单模型的似然函数最大值进行比较。如果参数限制是正确的,那么加入这样一个参数应当不会造成似然函数最大值的大幅变动。一般使用两者的比例来进行比较,这个比值是卡方分配。尼曼-皮尔森引理说明,似然比检验是所有具有同等显著性差异的检验中最有统计效力的检验。

相关

  • 研究中心研究中心,或称研究所、研究院、研究机构,是指以研究或研发为目的之设施、组织或机构。所做的研究通常都会聚焦于一个特定的领域。一个研究中心可能同时具有不同的学科或专业,同
  • 心理成熟心理成熟是指心理指随着时间的推移向着圆满生长,有能力以恰当的方式对社会环境做出适当反应。反应通常而言是靠学习而得到的,而非先天本能。成熟也意味着根据情况和社会文化,知
  • 卢·蒙特利卢·蒙特利(英语:Louis J. Montulli II)是一位以开发网页浏览器而闻名的程序员。在1991年和1992年,他与堪萨斯大学的迈克尔·格罗贝兹和查尔斯·雷扎克合作开发了一个名为Lynx的
  • Netscape Navigator 9Netscape Navigator 9是网景导航者浏览器最后的版本,由美国在线旗下的网景制作。自2004年将第8版的Netscape Browser委交Mercurial Communications制作以来,第一个重回网景制
  • 皮尔逊积矩相关系数在统计学中,皮尔逊积矩相关系数(英语:Pearson product-moment correlation coefficient,又称作 PPMCC或PCCs, 文章中常用r或Pearson's r表示)用于度量两个变量X和Y之间的相关程度
  • 剑龙剑龙属(属名:Stegosaurus)是一类已灭绝的草食性四足动物,是剑龙亚目的一个属。属名为Stegosaurus,源自希腊文中的.mw-parser-output .Polytonic{font-family:"SBL BibLit","SBL G
  • HADHB3032231086ENSG00000138029ENSMUSG00000059447P55084Q99JY0NM_000183、NM_001281512、NM_001281513、XM_011532803、XM_024452830、XM_024452831NM_145558、NM_001289798、N
  • 戈德里奇第一代里彭伯爵弗雷德里克·约翰·罗宾逊,PC(Frederick John Robinson, 1st Earl of Ripon,1782年11月1日-1859年1月28日),英国政治家,曾任英国首相,出生后至1827年,称为F·J·罗宾逊
  • C·S·路易斯克利夫·斯特普尔斯·刘易斯(英语:Clive Staples Lewis,1898年11月29日-1963年11月22日),通称C·S·刘易斯(C.S. Lewis)或 鲁益师,其朋友及家人昵称他为杰克(Jack),出生于北爱尔兰首府贝
  • 圣经圣经译本,是天主教、基督教和东正教等基督教派的宗教经典《圣经》的翻译文本。《圣经》原文在以古代希伯来语、亚兰语和通用希腊语写成,圣经全书或圣经某部分已被不同圣经学者