广义线性模式

✍ dations ◷ 2025-12-04 18:30:38 #广义线性模式

在统计学上，广义线性模型 (Generalized linear model、简称GLM) 是一种应用灵活的线性回归模型。该模型允许因变量的偏差分布有除了正态分布之外的其它分布。此模型假设实验者所量测的随机变量的分布函数与实验中系统性效应(即非随机的效应)可经由一链接函数（link function）建立起可资解释其相关性的函数。John Nelder与Peter McCullagh在1989年出版，被视为广义线性模式的代表性文献中提纲挈领地说明了广义线性模式的原理、计算（如最大概似估计量）及其实务应用。广义线性模型是简单最小二乘回归（OLS）的扩展，在广义线性模式中，假设每个资料的观测值 Y {displaystyle mathbf {Y} } 来自某个指数族分布。该分布的平均数 μ {displaystyle {boldsymbol {mu }}} 可由与该点独立的X解释：其中 E ( y ) {displaystyle E({boldsymbol {y}})} 为 y {displaystyle {boldsymbol {y}}} 的期望值， X β {displaystyle mathbf {X} {boldsymbol {beta }}} 是由未知待估计参数 β {displaystyle {boldsymbol {beta }}} 与已知变量 X {displaystyle mathbf {X} } 构成的线性估计式， g {displaystyle g} 则为链接函数。在此模式下， y {displaystyle {boldsymbol {y}}} 的方差 V {displaystyle V} 可表示为：一般假设 V {displaystyle V} 可视为一指数族随机变量的函数。未知参数 β {displaystyle {boldsymbol {beta }}} 通常会以最大概似估计量, 殆最大概似估计量, 或以贝氏方法来估计。广义线性模式包含了以下主要部分：指数族随机变量意指其具参数θ与τ的概率密度函数, f (在论离散型随机变量时，则为概率质量函数)可表为：τ称之为变异参数，通常用以解释方差。函数a、b、c、d 及h为已知。许多（不包含全部）型态的随机变量可归类为指数族θ与该随机变量的期望值有关。若a为恒等函数，则称该分布属于正则型式。另外，若b为恒等而τ已知，则θ称为正则参数，其与期望值的关系可表为：一般情形下，该分布的方差可表为：线性预测子是用将独立变量经由线性组合来寻模式所能提供之资讯的计量变量。符号η (希腊字母 "Η")通常用来表示线性预测子。它与资料的期望值的链接函数值有关(故称"预测子")。η表为未知参数β的线性组合(故为"线性")。X则为独立变量所组合而成的观测矩阵。如此一来，η可表示为X的元素通常为模式设计时可观测的资料或为实验时所得的数据。链接函数解释了线性预测子与分布期望值的关系。链接函数的选择可视情形而定。通常只要符合链接函数的值域有包含分布期望值的条件即可。当使用具正则参数θ的分布时，链接函数需符合XTY 为β的充份统计量此一条件。这在θ与线性预测子的链接函数值相等时方成立。下面列出若干指数族分布的典则链接函数及其反函数(有时称为均值函数)：在指数分布与Gamma分布中，其典则链接函数的值域并不包含分布均值，另外其线性预测子亦可能出现负值，此两种分布绝无均值为负的可能。当进行极大似然估计进行计算时需避免上述情形出现，这时便需要使用到非典则链接函数。有些人可能会把一般线性模式和广义线性模式给弄混了。一般线性模式可视为广义线性模式的一个链接函数为恒等的特例。一般线性模式有着悠长的发展历史。广义线性模式具非恒等链接函数者有着渐近一致的结果。广义线性模式最简单的例子便是线性回归。此例中分布函数为正态分布而链接函数为恒等函数在方差已知的条件下并符合正规式。这个例子具有广义线性模式罕有的最大概似估计量的解析解在讨论二元反应结果(如有跟没有)时，通常以二项式分布建模。其期望值'μi通常解释为样本Yi发生事件的概率p二项式分布有许多常用的链接函数，最常用的链接函数是logit：以此建模的广义线性模式通常称为logistic回归模式。另外，任何连续型概率分配累积函数(CDF)的反函数皆可使用此模式，因为其值域为，包含了二项式分布期望值的可能值域。正态概率分配累积函数 Φ {displaystyle Phi } 是一个广受应用于probit模式的选择。其链接函数为有时恒等函数也会被用为二项式分布的链接函数，其缺点为预测值可能超出合理范围。经过若干修正可以避免上述问题，但会在解释上造成困难。此模式通常适用于p接近0.5的情形。此种建模很接近logit及probit的线性转换，有时计量经济学家会称其为Harvard模式。二元资料的广义线性模式变异函数可写为其中变异参数 τ {displaystyle tau } 通常等于1，若非，则该模式称为溢变异或殆二元。另一个常用的例子为用于计次的卜瓦松分布。此例的链接函数为自然对数，为正规链接。方差函数与均值成等比其中变异参数 τ {displaystyle tau } 通常为1。若非，此模式通常称为溢变异或似卜瓦松。

相关

wikiWiki（i/ˈwɪkiː/）是在万维网上开放，且可供多人协同创作的超文本系统，由沃德·坎宁安于1995年首先开发。沃德·坎宁安将wiki定义为“一种允许一群用户用简单的描述来创建和连接
骨髓细胞髓细胞（myeloid，髓样）是指涉骨髓或脊髓的“粒细胞前体细胞”、或者骨髓或脊髓类似病症之形容词。例如，髓细胞白血病是起自骨髓的造血组织中异常的生长的一种白血病。在造血（Haema
鞘脂类代谢鞘脂（英文：Sphingolipids或glycosylceramides），是一种含有鞘氨醇碱的骨架的脂类，是脂肪族胺醇包含鞘氨醇。他们在1870年代的脑部提取物被发现和神话斯芬克斯来命名。医学导航：遗传
黑曜岩黑曜石（英语：Obsidian）又名十胜石，是一种自然产生的玻璃。成因是因为火山熔岩迅速冷却凝结，没有足够的时间让矿物晶体长出，而形成玻璃质。因为熔岩流外围冷却的速度最快，所以黑曜石
结构药物设计药物设计（英语：Drug design），又称理性药物设计（rational drug design），根据对于靶点（Biological target）的现有知识，去寻找与发明出新型药物的过程。药物设计根据有机小分子物质（如蛋白
焯焯（俗写灼），也叫焯水、飞水，是烹调的一种手法，即将被烹调的原料在开水或者清汤中暂短烫一下的处理过程。通常需要焯水的情况是，有腥臭味道的肉类，有苦味的蔬菜和需要保鲜增绿的蔬菜
加勒比区荷兰加勒比区（荷兰语：Caribisch Nederland）是属于荷兰本土的三个公共实体：博奈尔、圣尤斯特歇斯和萨巴的集体名称，又称BES群岛，其地名已在国际标准化组织的ISO 3166-1国际标准注册
最大行政区一级行政区是指直接受国家直辖、或独立政权管辖的行政区划，属于相对概念。在汉语环境中，直属中央政府管辖之行政区称为“省级行政区”（或“国家一级行政区”）。而由多个国家合并
熔盐堆熔盐反应堆（英语：molten salt reactor, MSR）是核裂变反应堆的一种，属于第四代反应堆，其主冷却剂（英语：nuclear reactor coolant）以至燃料本身都是熔盐混合物，它可以在高温下工作（可获
诉诸顽固诉诸顽固（英语：appeal to the stone；拉丁语：argumentum ad lapidem），是一种非形式谬误，是重复声明某个主张不合理，却不提出理据。