首页 >
回归诊断
✍ dations ◷ 2025-04-04 11:26:18 #回归诊断
回归分析(英语:Regression Analysis)是一种统计学上分析数据的方法,目的在于了解两个或多个变量间是否相关、相关方向与强度,并建立数学模型以便观察特定变量来预测研究者感兴趣的变量。更具体的来说,回归分析可以帮助人们了解在只有一个自变量变化时因变量的变化量。一般来说,通过回归分析我们可以由给出的自变量估计因变量的条件期望。回归分析是建立因变量
Y
{displaystyle Y}
(或称依变量,反因变量)与自变量
X
{displaystyle X}
(或称独变量,解释变量)之间关系的模型。简单线性回归使用一个自变量
X
{displaystyle X}
,复回归使用超过一个自变量(
X
1
,
X
2
.
.
.
X
i
{displaystyle X_{1},X_{2}...X_{i}}
)。回归的最早形式是最小二乘法,由1805年的勒让德(Legendre),和1809年的高斯(Gauss)出版。勒让德和高斯都将该方法应用于从天文观测中确定关于太阳的物体的轨道(主要是彗星,但后来是新发现的小行星)的问题。 高斯在1821年发表了最小二乘理论的进一步发展,包括高斯-马尔可夫定理的一个版本。“回归”一词最早由法兰西斯·高尔顿(Francis Galton)所使用。他曾对亲子间的身高做研究,发现父母的身高虽然会遗传给子女,但子女的身高却有逐渐“回归到中等(即人的平均值)”的现象。不过当时的回归和现在的回归在意义上已不尽相同。在1950年代和60年代,经济学家使用机械电子桌面计算器来计算回归。在1970年之前,它有时需要长达24小时从一个回归接收结果。回归模型主要包括以下变量:回归模型将
Y
{displaystyle Y}
和一个关于
X
{displaystyle mathbf {X} }
和
β
{displaystyle beta }
的函数关联起来。在不同的应用领域有各自不同的术语代替这里的“自变量”和“因变量”。这个估计值通常写作:
E
(
X
|
Y
)
=
f
(
X
,
β
)
{displaystyle E(X|Y)=f(mathbf {X} ,{boldsymbol {beta }})}
。在进行回归分析时,函数
f
{displaystyle f}
的形式必须预先指定。有时函数
f
{displaystyle f}
的形式是在对
Y
{displaystyle Y}
和
X
{displaystyle mathbf {X} }
关系的已有知识上建立的,而不是在数据的基础之上。如果没有这种已有知识,那么就要选择一个灵活和便于回归的
f
{displaystyle f}
的形式。假设现在未知向量
β
{displaystyle beta }
的维数为k。为了进行回归分析,必须要先有关于
Y
{displaystyle Y}
的信息:在最后一种情况下,回归分析提供了一种完成以下任务的工具:
⒈找出一个未知量
β
{displaystyle beta }
的解使因变量
Y
{displaystyle Y}
的预测值和实际值差别最小(又称最小二乘法)。⒉在特定统计假设下,回归分析使用数据中的多余信息给出关于因变量
Y
{displaystyle Y}
和未知量
β
{displaystyle beta }
之间的关系。简单线性回归(英语:Simple linear regression)(英语:simple linear regression)复回归分析(英语:multiple regression analysis)是简单线性回归的一种延伸应用,用以了解一个依变项与两组以上自变项的函数关系。对数线性回归(英语:Log-linear model)(英语:Log-linear model),是将解释变项(实验设计中的自变项)和反应变项(实验设计中的依变项)都取对数值之后再进行线性回归,所以依据解释变项的数量,可能是对数简单线性回归,也可能是对数复回归。对数几率回归(英语:Logistic Regression)偏回归(英语:Partial Regression)(英语:Partial Regression)
相关
- 糖原生成糖原生成(英语:Glycogenesis)是指生物体中糖原合成的过程,其中葡萄糖分子被添加到糖原链上以用于储存。在肝脏进行完科里循环后的休息时期,此过程被启动起来;胰岛素也可以启动这一
- 阿尔伯特·冯·科立克阿尔伯特·冯·科立克(德语:Rudolf Albert von Kölliker,1817年7月6日-1905年11月2日),瑞士解剖学家与生理学家,线粒体的发现者。
- 相机广义上,照相机是任何可以捕捉和记录影像的设备。最常见的照相机拍摄可见光的影像,但并不是所有照相机都需要可见光(如红外线热像仪),有的甚至不需要一个传统意义上的光源(如扫描隧
- 塔林塔林(爱沙尼亚语:Tallinn)是波罗的海最内部的芬兰湾滨的爱沙尼亚共和国的首都。旧称列巴尔(德语、丹麦语: Reval),沙俄时代名为列威利(Ревель),前苏联时代名为塔林(Таллин
- 中原王朝中原王朝,通常是指历史上定都于中原的王朝。它既包含汉族在中原地区建立的王朝,也包含蒙古族和满族等其他非汉族定都于中原的王朝。中原王朝在学术上有两种定义:一则以中原文明
- 秦岭-淮河秦岭-淮河线是中国一条带有多重历史特殊意义的地理分界线。这条线的提出,首次正确界定了中国南北方的自然地理分界线,被认为对于认识中国自然地理规律和指导农业生产具有重要
- 送神日祭灶节是东亚传统节日,也被称为小年、谢节、送灶、祭灶、灶王节等,琉球语称为“御愿解”。在不同的地方日期不同,一般都在农历腊月二十四当日,或前后一日。祭灶节被视为过年的开
- 宏量常量元素,又称宏量元素、大量元素,指在体内含量丰富的元素。常量元素指在体内含量占生物体总质量0.01%以上的化学元素,计有碳、氢、氧、氮、磷、硫、氯、钾、钠、钙和镁,这些元
- 东非共同体东非共同体(简称东共体;英文:East African Community,EAC)是由肯尼亚、乌干达、坦桑尼亚、布隆迪、卢旺达和南苏丹六个东非国家组成的区域性国际组织。该组织于1967年首次成立,197
- 黄禹锡黄禹锡(韩语:황우석,1952年12月15日-),大韩民国生物学家,出生于忠清南道扶余郡的一间穷苦人家,曾经担任首尔大学兽医系首席教授。他在干细胞的研究一度令他成为韩国人的民族英雄、视