回归

✍ dations ◷ 2025-05-16 22:03:00 #回归
回归分析(英语:Regression Analysis)是一种统计学上分析数据的方法,目的在于了解两个或多个变量间是否相关、相关方向与强度,并建立数学模型以便观察特定变量来预测研究者感兴趣的变量。更具体的来说,回归分析可以帮助人们了解在只有一个自变量变化时因变量的变化量。一般来说,通过回归分析我们可以由给出的自变量估计因变量的条件期望。回归分析是建立因变量 Y {displaystyle Y} (或称依变量,反因变量)与自变量 X {displaystyle X} (或称独变量,解释变量)之间关系的模型。简单线性回归使用一个自变量 X {displaystyle X} ,复回归使用超过一个自变量( X 1 , X 2 . . . X i {displaystyle X_{1},X_{2}...X_{i}} )。回归的最早形式是最小二乘法,由1805年的勒让德(Legendre),和1809年的高斯(Gauss)出版。勒让德和高斯都将该方法应用于从天文观测中确定关于太阳的物体的轨道(主要是彗星,但后来是新发现的小行星)的问题。 高斯在1821年发表了最小二乘理论的进一步发展,包括高斯-马尔可夫定理的一个版本。“回归”一词最早由法兰西斯·高尔顿(Francis Galton)所使用。他曾对亲子间的身高做研究,发现父母的身高虽然会遗传给子女,但子女的身高却有逐渐“回归到中等(即人的平均值)”的现象。不过当时的回归和现在的回归在意义上已不尽相同。在1950年代和60年代,经济学家使用机械电子桌面计算器来计算回归。在1970年之前,它有时需要长达24小时从一个回归接收结果。回归模型主要包括以下变量:回归模型将 Y {displaystyle Y} 和一个关于 X {displaystyle mathbf {X} } 和 β {displaystyle beta } 的函数关联起来。在不同的应用领域有各自不同的术语代替这里的“自变量”和“因变量”。这个估计值通常写作: E ( X | Y ) = f ( X , β ) {displaystyle E(X|Y)=f(mathbf {X} ,{boldsymbol {beta }})} 。在进行回归分析时,函数 f {displaystyle f} 的形式必须预先指定。有时函数 f {displaystyle f} 的形式是在对 Y {displaystyle Y} 和 X {displaystyle mathbf {X} } 关系的已有知识上建立的,而不是在数据的基础之上。如果没有这种已有知识,那么就要选择一个灵活和便于回归的 f {displaystyle f} 的形式。假设现在未知向量 β {displaystyle beta } 的维数为k。为了进行回归分析,必须要先有关于 Y {displaystyle Y} 的信息:在最后一种情况下,回归分析提供了一种完成以下任务的工具: ⒈找出一个未知量 β {displaystyle beta } 的解使因变量 Y {displaystyle Y} 的预测值和实际值差别最小(又称最小二乘法)。⒉在特定统计假设下,回归分析使用数据中的多余信息给出关于因变量 Y {displaystyle Y} 和未知量 β {displaystyle beta } 之间的关系。简单线性回归(英语:Simple linear regression)(英语:simple linear regression)复回归分析(英语:multiple regression analysis)是简单线性回归的一种延伸应用,用以了解一个依变项与两组以上自变项的函数关系。对数线性回归(英语:Log-linear model)(英语:Log-linear model),是将解释变项(实验设计中的自变项)和反应变项(实验设计中的依变项)都取对数值之后再进行线性回归,所以依据解释变项的数量,可能是对数简单线性回归,也可能是对数复回归。对数几率回归(英语:Logistic Regression)偏回归(英语:Partial Regression)(英语:Partial Regression)

相关

  • 乳胶乳胶是指从天然的树木(被子植物,例如橡胶树)中抽取的树液,在空气中会凝固。它是一种微粒(英语:Microparticles)聚合物混合的乳剂,成分包括蛋白质、生物碱、淀粉、糖类、植物油、单宁
  • 酵母纲酵母菌纲(学名:Saccharomycetes)是在真菌界的子囊菌门以下的纲,是酵母亚门以下唯一的纲。酵母菌纲中只有一个目,是酵母菌目(Saccharomycetales)。酵母菌纲之下包括有近千个已知物种
  • 雅典执政官列表雅典自从公元前1068年废除王政以来,权利转往执政官手中。雅典的第一任执政官是墨冬,他是雅典末代国王科德鲁斯的儿子。由于,科德鲁斯在位时,多利亚人从墨伽拉进犯雅典。德尔斐神
  • 肽链肽(英语:peptide,来自希腊文的“消化”),旧称胜,即胜肽,又称缩氨酸,是天然存在的小生物分子,介于氨基酸和蛋白质之间的物质。由于氨基酸的分子最小,蛋白质最大,而它们则是氨基酸单体组
  • 简单重复序列微卫星(英语:Microsatellite,亦称为简单重复序列(英语:Simple Sequence Repeats,SSRs)或短串联重复序列(英语:short tandem repeats,STRs))是多型性的一种类型。指两个或多个核苷酸重复
  • 编年史年代记(Chronicle)是一种用年代来排序的来记录历史事实和事件的文献记载方法。通常同时考虑历史上重要事件和本地事件的权重,此用来记录发生的和年代记编纂者的观点。对比故事
  • 压力油炸压力油炸是在密封的油炸炉中炸制食物的烹饪方法。进行压力油炸时,食物释放的蒸汽不会流失。因为锅中的气压高,油的沸点也随之升高,使烹饪时的油温升高,食物能较快变熟,食物的外观
  • 自我组装自组装(英语:Self-assembly,或译自我组装)是用来形容一无序系统在没有外部的干预下,由个别部件间之互动(如吸引和排斥,或自发生成化学键),而组成一个有组织的结构之过程。近年自组装
  • compulsions强迫行为(英语:Compulsive behavior),又称作态行为,是一种重复与持续的行为,当事人无法由这种行为中获得益处或满足感,但难以停止去做这种行为的内在冲动。这类行为在一般人的身上
  • 四大汗国蒙古四大汗国,简称四大汗国,是对蒙古帝国及其分裂后存在的窝阔台汗国、察合台汗国、钦察汗国、伊儿汗国这四个蒙古汗国的合称。早在成吉思汗时期,成吉思汗将大蒙古国的土地分给