回归

✍ dations ◷ 2025-08-13 03:08:27 #回归
回归分析(英语:Regression Analysis)是一种统计学上分析数据的方法,目的在于了解两个或多个变量间是否相关、相关方向与强度,并建立数学模型以便观察特定变量来预测研究者感兴趣的变量。更具体的来说,回归分析可以帮助人们了解在只有一个自变量变化时因变量的变化量。一般来说,通过回归分析我们可以由给出的自变量估计因变量的条件期望。回归分析是建立因变量 Y {displaystyle Y} (或称依变量,反因变量)与自变量 X {displaystyle X} (或称独变量,解释变量)之间关系的模型。简单线性回归使用一个自变量 X {displaystyle X} ,复回归使用超过一个自变量( X 1 , X 2 . . . X i {displaystyle X_{1},X_{2}...X_{i}} )。回归的最早形式是最小二乘法,由1805年的勒让德(Legendre),和1809年的高斯(Gauss)出版。勒让德和高斯都将该方法应用于从天文观测中确定关于太阳的物体的轨道(主要是彗星,但后来是新发现的小行星)的问题。 高斯在1821年发表了最小二乘理论的进一步发展,包括高斯-马尔可夫定理的一个版本。“回归”一词最早由法兰西斯·高尔顿(Francis Galton)所使用。他曾对亲子间的身高做研究,发现父母的身高虽然会遗传给子女,但子女的身高却有逐渐“回归到中等(即人的平均值)”的现象。不过当时的回归和现在的回归在意义上已不尽相同。在1950年代和60年代,经济学家使用机械电子桌面计算器来计算回归。在1970年之前,它有时需要长达24小时从一个回归接收结果。回归模型主要包括以下变量:回归模型将 Y {displaystyle Y} 和一个关于 X {displaystyle mathbf {X} } 和 β {displaystyle beta } 的函数关联起来。在不同的应用领域有各自不同的术语代替这里的“自变量”和“因变量”。这个估计值通常写作: E ( X | Y ) = f ( X , β ) {displaystyle E(X|Y)=f(mathbf {X} ,{boldsymbol {beta }})} 。在进行回归分析时,函数 f {displaystyle f} 的形式必须预先指定。有时函数 f {displaystyle f} 的形式是在对 Y {displaystyle Y} 和 X {displaystyle mathbf {X} } 关系的已有知识上建立的,而不是在数据的基础之上。如果没有这种已有知识,那么就要选择一个灵活和便于回归的 f {displaystyle f} 的形式。假设现在未知向量 β {displaystyle beta } 的维数为k。为了进行回归分析,必须要先有关于 Y {displaystyle Y} 的信息:在最后一种情况下,回归分析提供了一种完成以下任务的工具: ⒈找出一个未知量 β {displaystyle beta } 的解使因变量 Y {displaystyle Y} 的预测值和实际值差别最小(又称最小二乘法)。⒉在特定统计假设下,回归分析使用数据中的多余信息给出关于因变量 Y {displaystyle Y} 和未知量 β {displaystyle beta } 之间的关系。简单线性回归(英语:Simple linear regression)(英语:simple linear regression)复回归分析(英语:multiple regression analysis)是简单线性回归的一种延伸应用,用以了解一个依变项与两组以上自变项的函数关系。对数线性回归(英语:Log-linear model)(英语:Log-linear model),是将解释变项(实验设计中的自变项)和反应变项(实验设计中的依变项)都取对数值之后再进行线性回归,所以依据解释变项的数量,可能是对数简单线性回归,也可能是对数复回归。对数几率回归(英语:Logistic Regression)偏回归(英语:Partial Regression)(英语:Partial Regression)

相关

  • 遗传学家遗传学家是指研究遗传学的科学家。遗传学家通过进行多种相关的科学实验和数据分析,试图对遗传现象和物种差异进行科学解释。遗传学家可以以教师或研究者为职业。大多数遗传学
  • 过氧化物过氧化物,指一类含有过氧基-O-O-的化合物,具有强氧化性,又可分为有机过氧化物与无机过氧化物。在包含过氧基的化合物中,每个氧原子的氧化数为 -1。1798年德国科学家亚历山大·冯·
  • 圣卢西亚面积以下资讯是以2018年估计国家领袖国内生产总值(购买力平价) 以下资讯是以2016年估计国内生产总值(国际汇率) 以下资讯是以2016年估计人类发展指数 以下资讯是以2018年估计圣
  • 编码编码是信息从一种形式或格式转换为另一种形式的过程;解码则是编码的逆过程。对于特定的上下文,编码有一些更具体的意义。
  • 线粒体穿梭线粒体穿梭(英语:mitochondrial shuttles)是用来转运还原剂穿过线粒体内膜的体系。还原型烟酰胺腺嘌呤二核苷酸无法穿过该膜,但它可以还原其他可以穿过该膜物质,以便于它所携带的
  • 纳瓦族纳瓦人,又称纳瓦特尔人(纳瓦特尔语:Nahuatlacah;西班牙语:Nahuas)指的是位在墨西哥中部使用阿兹特克方言—纳瓦特尔语的族群。其为墨西哥最大的美洲原住民族群(1990统计人数为1,197
  • 丑纪范丑纪范(1934年7月23日-),中国湖南省长沙市人,气象学家,中国科学院院士。丑纪范1956年毕业于北京大学物理系,毕业后进入中央气象科学研究所工作,1962年首先在世界上提出将数值天气预
  • 法兰西斯·高尔顿弗朗西斯·高尔顿爵士,FRS(英语:Sir Francis Galton,1822年2月16日-1911年1月17日),英格兰维多利亚时代的博学家、人类学家、优生学家、热带探险家、地理学家、发明家、气象学家、
  • 代郡代郡,中国古郡名。战国时代赵国首设,今河北蔚县一带。秦朝四十八郡之一。西汉时属并州刺史部辖;东汉时属于幽州刺史部管辖。户五万六千七百七十一,口二十七万八千七百五十四。下
  • 皱纹皱纹又称皮皱、褶纹、纹皱、褶子等,主要指人类或动物皮肤的褶皱。人类在老化的过程中多少会在脸部前额、眼外眦、耳前区、颊、下颏、口周、脖颈、腋下、肘内、手腕、手面、手