首页 >
回归分析
✍ dations ◷ 2025-07-22 02:46:39 #回归分析
回归分析(英语:Regression Analysis)是一种统计学上分析数据的方法,目的在于了解两个或多个变量间是否相关、相关方向与强度,并建立数学模型以便观察特定变量来预测研究者感兴趣的变量。更具体的来说,回归分析可以帮助人们了解在只有一个自变量变化时因变量的变化量。一般来说,通过回归分析我们可以由给出的自变量估计因变量的条件期望。回归分析是建立因变量
Y
{displaystyle Y}
(或称依变量,反因变量)与自变量
X
{displaystyle X}
(或称独变量,解释变量)之间关系的模型。简单线性回归使用一个自变量
X
{displaystyle X}
,复回归使用超过一个自变量(
X
1
,
X
2
.
.
.
X
i
{displaystyle X_{1},X_{2}...X_{i}}
)。回归的最早形式是最小二乘法,由1805年的勒让德(Legendre),和1809年的高斯(Gauss)出版。勒让德和高斯都将该方法应用于从天文观测中确定关于太阳的物体的轨道(主要是彗星,但后来是新发现的小行星)的问题。 高斯在1821年发表了最小二乘理论的进一步发展,包括高斯-马尔可夫定理的一个版本。“回归”一词最早由法兰西斯·高尔顿(Francis Galton)所使用。他曾对亲子间的身高做研究,发现父母的身高虽然会遗传给子女,但子女的身高却有逐渐“回归到中等(即人的平均值)”的现象。不过当时的回归和现在的回归在意义上已不尽相同。在1950年代和60年代,经济学家使用机械电子桌面计算器来计算回归。在1970年之前,它有时需要长达24小时从一个回归接收结果。回归模型主要包括以下变量:回归模型将
Y
{displaystyle Y}
和一个关于
X
{displaystyle mathbf {X} }
和
β
{displaystyle beta }
的函数关联起来。在不同的应用领域有各自不同的术语代替这里的“自变量”和“因变量”。这个估计值通常写作:
E
(
X
|
Y
)
=
f
(
X
,
β
)
{displaystyle E(X|Y)=f(mathbf {X} ,{boldsymbol {beta }})}
。在进行回归分析时,函数
f
{displaystyle f}
的形式必须预先指定。有时函数
f
{displaystyle f}
的形式是在对
Y
{displaystyle Y}
和
X
{displaystyle mathbf {X} }
关系的已有知识上建立的,而不是在数据的基础之上。如果没有这种已有知识,那么就要选择一个灵活和便于回归的
f
{displaystyle f}
的形式。假设现在未知向量
β
{displaystyle beta }
的维数为k。为了进行回归分析,必须要先有关于
Y
{displaystyle Y}
的信息:在最后一种情况下,回归分析提供了一种完成以下任务的工具:
⒈找出一个未知量
β
{displaystyle beta }
的解使因变量
Y
{displaystyle Y}
的预测值和实际值差别最小(又称最小二乘法)。⒉在特定统计假设下,回归分析使用数据中的多余信息给出关于因变量
Y
{displaystyle Y}
和未知量
β
{displaystyle beta }
之间的关系。简单线性回归(英语:Simple linear regression)(英语:simple linear regression)复回归分析(英语:multiple regression analysis)是简单线性回归的一种延伸应用,用以了解一个依变项与两组以上自变项的函数关系。对数线性回归(英语:Log-linear model)(英语:Log-linear model),是将解释变项(实验设计中的自变项)和反应变项(实验设计中的依变项)都取对数值之后再进行线性回归,所以依据解释变项的数量,可能是对数简单线性回归,也可能是对数复回归。对数几率回归(英语:Logistic Regression)偏回归(英语:Partial Regression)(英语:Partial Regression)
相关
- 兼性厌氧菌厌氧生物,或称厌气生物,是指一种不需要氧气生长的生物。它们大致上可以分为三种,即专性厌氧生物、兼性厌氧生物及耐氧厌氧生物 。人体内的厌氧生物多存在于消化系统中,有些种类
- 木乃伊木乃伊是在人工防腐情况下或自然条件下可以长久保存的尸体。木乃伊一词源自波斯语“موم”(mūm),原义为蜡,欧洲人用来指古埃及涂抹防腐香料保存至今的尸体,中国自明代以来将
- 重金属重金属有许多种不同的定义。在科学界常见的一种定义是密度大于5的金属,大多数金属都是重金属。重金属的化学性质一般上较为稳定。在冶金工业中,有色金属不只依照密度,也会依其
- 杀虫剂杀虫剂是一种施用对象为昆虫的农药,经常用于农业、医药、工业及居家环境。杀虫剂可针对处于所有发展阶段的昆虫,包括杀卵剂和杀幼虫剂。在公元前2500年之前,人类就开始使用农药
- 麦角固醇麦角固醇(英语:Ergosterol,又称为麦角甾醇)是从真菌类酵母与麦角菌中发现的一种植物固醇。在紫外线照射下可被转化为维生素D2。它是酵母和真菌细胞膜的组成部分,功能与动物细胞膜
- 半索动物门半索动物门(学名:Hemichordata)是由一类像虫一般,生存于海底的后口动物所组成的门,通常被认为是棘皮动物的旁系群,可追溯至寒武纪早期或晚期,且包括一类已在石炭纪时灭绝的重要化石
- 螨虫见内文蠕形螨属(学名:Demodex),又称毛囊螨或毛囊虫,亦即俗称的“螨虫”的一部分,是小型寄生螨类的一个属。 常寄生于哺乳动物的毛囊内。目前已知蠕形螨有约65个种,140多个亚种;它们
- 鼻烟鼻烟(英语:Snuff),一种无烟烟草制品。把烟草研磨成极细的粉末,以嗅闻的方式吸取进入鼻腔,经由鼻腔吸收其中的尼古丁成分。其中可以加入麝香等药材,或用花卉等提炼。烟味分五种:膻、
- 领土美国领地是指美国行政区划的一种分类,其领土由美国政府管理但不属于美国任何一个州。建立这些领地的目的是为了管理这些新获得的地区,因为当时美国领土的边界还在扩张中。这些
- EDTA-2Na乙二胺四乙酸(英语:Ethylenediaminetetraacetic acid),常缩写为EDTA,是一种有机化合物。它是一个六齿配体,可以螯著多种金属离子。它的4个酸和2个胺的部分都可作为配体的齿,与锰(II)