偏差信息量准则

✍ dations ◷ 2025-12-03 19:28:57 #贝叶斯统计,回归分析

偏差信息量准则(英语:deviance information criterion,DIC)是等级模型化的赤池信息量准则(AIC),被广泛应用于由马尔可夫链蒙特卡洛(MCMC)模拟出的后验分布的贝叶斯模型选择问题。和赤池信息量准则一样,偏差信息量准则是随样本容量增加的渐近近似,只应用于后验分布呈多元正态分布的情况。


定义偏差(deviance)为 D ( θ ) = 2 log ( p ( y | θ ) ) + C {\displaystyle D(\theta )=-2\log(p(y|\theta ))+C} ,其中 y {\displaystyle y} 为数据, θ {\displaystyle \theta } 是模型中的未知参量, p ( y | θ ) {\displaystyle p(y|\theta )} 是似然函数, C {\displaystyle C} 是常量。

有两种计算模型参数的有效数量 p D {\displaystyle p_{D}} 的方法。一种是 p D = D ¯ D ( θ ¯ ) {\displaystyle p_{D}={\bar {D}}-D({\bar {\theta }})} ,其中 θ ¯ {\displaystyle {\bar {\theta }}} θ {\displaystyle \theta } 的期望(Spiegelhalter 等人 2002,p.587)。第二种是 p D = p V = 1 2 var ^ ( D ( θ ) ) {\displaystyle p_{D}=p_{V}={\frac {1}{2}}{\widehat {\operatorname {var} }}\left(D(\theta )\right)} (Gelman 等人 2004,p.182)。有效数量 p D {\displaystyle p_{D}} 越大,模型的参数就越多,模型就越容易拟合数据,但也需要更小的偏差。

偏差信息量准则 D I C {\displaystyle {\mathit {DIC}}} 被定义为

或等效于

从第二种定义更能看出它和赤池信息量准则的联系。

一般而言,偏差信息量准则 D I C {\displaystyle {\mathit {DIC}}} 的值越小,模型越好。这一准则的优点是它很容易从马尔可夫链蒙特卡洛(MCMC)模拟产生的样本中计算出来。


相关

  • 植物细胞植物细胞学(Plant Cell Biology,或传统上的plant cytology) 研究植物细胞结构的科学,是广义的形态学的一部分,也是细胞学的一个分支。植物细胞学以植物细胞作为研究对象,利用生
  • 约斯特·范·登·冯德尔约斯特·范·登·冯德尔 (荷兰语:Joost van den Vondel,1587年-1679年),17世纪荷兰黄金时代的诗人和剧作家,善于悲剧,被认为是17世纪最杰出的荷兰诗人和剧作家。他在2004年票选最伟
  • 生育能力测试生育能力测试(Fertility testing)是评估生育能力的程序,也用来确认女性容易受孕的期间(即危险期)。生育能力和整体的健康有关,而性感染疾病也会影响生育能力。健康的女性自青春期
  • 星冰乐星冰乐(英语:Frappuccino),又名法布奇诺,是星巴克的注册商标,也是特调冰饮与瓶装咖啡饮品的名称。一家总部位于波士顿的廿四小时连锁店The Coffee Connection发明了与星巴克星冰乐
  • 蒂科钦大屠杀蒂科钦大屠杀是1941年8月25日发生在波兰蒂科钦的屠杀犹太人事件。在屠杀事件中,该镇的犹太居民被德国别动支队(英语:Einsatzkommando)杀害。苏联和德国入侵波兰期间,蒂科钦镇依据
  • 日本书纪《日本书纪》(日语:日本書紀/にほんしょき Nihon shoki)是日本留传至今最早之正史,六国史之首,原名《日本纪》,舍人亲王等人所撰,于公元681年至720年(养老4年)完成。记述神代乃至持统
  • 伊朗门事件军售伊朗丑闻或称伊朗门事件(Irangate 或Iran-Contra Affair)是发生在美国80年代中期的政治丑闻。是指美国里根政府向伊朗秘密出售武器一事被揭露后而造成严重政治危机的事件
  • 兖沂曹济道兖沂曹济道,清朝到民国初期设置的道,属于山东省。雍正九年(1731年)七月设置兖莒沂道,驻沂州,管辖沂州直隶州(治今山东省临沂市)、莒州直隶州(治今山东省莒县)、兖州府(治今山东省济宁市
  • 电池列表电池列表将尽量列出所有类型的电池,并列出别名以方便查考,易混淆的项目附加简要说明。
  • 文本挖掘文本挖掘有时也被称为文字探勘、文本数据挖掘等,大致相当于文字分析,一般指文本处理过程中产生高质量的信息。高质量的信息通常通过分类和预测来产生,如模式识别。文本挖掘通常