回归

✍ dations ◷ 2025-04-04 11:21:37 #回归
回归分析(英语:Regression Analysis)是一种统计学上分析数据的方法,目的在于了解两个或多个变量间是否相关、相关方向与强度,并建立数学模型以便观察特定变量来预测研究者感兴趣的变量。更具体的来说,回归分析可以帮助人们了解在只有一个自变量变化时因变量的变化量。一般来说,通过回归分析我们可以由给出的自变量估计因变量的条件期望。回归分析是建立因变量 Y {displaystyle Y} (或称依变量,反因变量)与自变量 X {displaystyle X} (或称独变量,解释变量)之间关系的模型。简单线性回归使用一个自变量 X {displaystyle X} ,复回归使用超过一个自变量( X 1 , X 2 . . . X i {displaystyle X_{1},X_{2}...X_{i}} )。回归的最早形式是最小二乘法,由1805年的勒让德(Legendre),和1809年的高斯(Gauss)出版。勒让德和高斯都将该方法应用于从天文观测中确定关于太阳的物体的轨道(主要是彗星,但后来是新发现的小行星)的问题。 高斯在1821年发表了最小二乘理论的进一步发展,包括高斯-马尔可夫定理的一个版本。“回归”一词最早由法兰西斯·高尔顿(Francis Galton)所使用。他曾对亲子间的身高做研究,发现父母的身高虽然会遗传给子女,但子女的身高却有逐渐“回归到中等(即人的平均值)”的现象。不过当时的回归和现在的回归在意义上已不尽相同。在1950年代和60年代,经济学家使用机械电子桌面计算器来计算回归。在1970年之前,它有时需要长达24小时从一个回归接收结果。回归模型主要包括以下变量:回归模型将 Y {displaystyle Y} 和一个关于 X {displaystyle mathbf {X} } 和 β {displaystyle beta } 的函数关联起来。在不同的应用领域有各自不同的术语代替这里的“自变量”和“因变量”。这个估计值通常写作: E ( X | Y ) = f ( X , β ) {displaystyle E(X|Y)=f(mathbf {X} ,{boldsymbol {beta }})} 。在进行回归分析时,函数 f {displaystyle f} 的形式必须预先指定。有时函数 f {displaystyle f} 的形式是在对 Y {displaystyle Y} 和 X {displaystyle mathbf {X} } 关系的已有知识上建立的,而不是在数据的基础之上。如果没有这种已有知识,那么就要选择一个灵活和便于回归的 f {displaystyle f} 的形式。假设现在未知向量 β {displaystyle beta } 的维数为k。为了进行回归分析,必须要先有关于 Y {displaystyle Y} 的信息:在最后一种情况下,回归分析提供了一种完成以下任务的工具: ⒈找出一个未知量 β {displaystyle beta } 的解使因变量 Y {displaystyle Y} 的预测值和实际值差别最小(又称最小二乘法)。⒉在特定统计假设下,回归分析使用数据中的多余信息给出关于因变量 Y {displaystyle Y} 和未知量 β {displaystyle beta } 之间的关系。简单线性回归(英语:Simple linear regression)(英语:simple linear regression)复回归分析(英语:multiple regression analysis)是简单线性回归的一种延伸应用,用以了解一个依变项与两组以上自变项的函数关系。对数线性回归(英语:Log-linear model)(英语:Log-linear model),是将解释变项(实验设计中的自变项)和反应变项(实验设计中的依变项)都取对数值之后再进行线性回归,所以依据解释变项的数量,可能是对数简单线性回归,也可能是对数复回归。对数几率回归(英语:Logistic Regression)偏回归(英语:Partial Regression)(英语:Partial Regression)

相关

  • 粉笔河实验室粉笔河实验室,或称乔克河核子实验室(英语:Chalk River Laboratories)是位于加拿大安大略省的国家级实验室。始于1945年,主要从事核能相关的研究,像是研发加拿大重水铀反应堆。此外
  • 操作定义操作定义(operational definition)是指将一些事物如变量、术语与客体等以某种操作的方式表示出来。操作定义与概念型定义(英语:conceptual definition)相区别,强调确立事物特征时
  • 炭疽芽孢杆菌炭疽杆菌是一种棒状的革兰氏阳性菌,长约1至6微米,这种细菌通常以内孢子之型态出现在土壤中,并可借此状态存活数十年之久,一旦由牲畜摄入,孢子便开始在动物体内大量复制,最后造成死
  • 初级生产初级生产(英语:primary production),又称初级生产量,是指从大气中或水中的二氧化碳等无机分子合成有机化合物的一个总和量,数值越高代表合成能力就越强。以生物消费者观点直观地说
  • 甲基丙二酸单酰辅酶A差向异构酶甲基丙二酸单酰辅酶A差向异构酶(英语:Methylmalonyl CoA epimerase,亦可简称为甲基丙二酰辅酶A表异构酶)是一种将(S)-甲基丙二酸单酰辅酶A转换为(R)型。Template:Isomerase-stub
  • 霍尔登氏法则霍尔登氏法则(英语:Haldane's rule),是一个群体遗传学性别决定法则,由约翰·伯顿·桑德森·霍尔丹(J.B.S.Haldane)在1922年首次提出。霍尔登氏法则说的是,当近缘物种或半种杂交后,如
  • 外贝加尔边疆区外贝加尔边疆区 (俄语:Забайкальский край,罗马化:Zabaykalsky krai)是俄罗斯的一个联邦主体,由原赤塔州和阿金布里亚特区合并而成。合并由2007年3月11日公民投
  • 上党郡上党郡,是中国古代设立的一个郡级行政区划,其最广大时的范围,大致包括了今天的山西省长治市全境,晋城市大部,全境及晋中市东部的榆社县、和顺县、昔阳县、左权县(辽县)等地。上党的
  • 林地疏林是一个植被主要为树木的土地,疏林为森林的一种,和森林的不同处在于两者的树冠。在森林中,大部分的树冠都是相连的。因此,阳光不能轻易的到达地面;疏林则容许阳光透入地面,但仍
  • 亲油性亲脂性是指一个化合物融解在脂肪、油、脂质或非极性溶剂的能力。这些非极性溶剂本身就亲脂,所以这告诉我们“相似相溶”。因此亲脂性的物质就会溶在亲脂的溶剂,亲水性的物质就