回归

✍ dations ◷ 2024-12-22 20:49:44 #回归
回归分析(英语:Regression Analysis)是一种统计学上分析数据的方法,目的在于了解两个或多个变量间是否相关、相关方向与强度,并建立数学模型以便观察特定变量来预测研究者感兴趣的变量。更具体的来说,回归分析可以帮助人们了解在只有一个自变量变化时因变量的变化量。一般来说,通过回归分析我们可以由给出的自变量估计因变量的条件期望。回归分析是建立因变量 Y {displaystyle Y} (或称依变量,反因变量)与自变量 X {displaystyle X} (或称独变量,解释变量)之间关系的模型。简单线性回归使用一个自变量 X {displaystyle X} ,复回归使用超过一个自变量( X 1 , X 2 . . . X i {displaystyle X_{1},X_{2}...X_{i}} )。回归的最早形式是最小二乘法,由1805年的勒让德(Legendre),和1809年的高斯(Gauss)出版。勒让德和高斯都将该方法应用于从天文观测中确定关于太阳的物体的轨道(主要是彗星,但后来是新发现的小行星)的问题。 高斯在1821年发表了最小二乘理论的进一步发展,包括高斯-马尔可夫定理的一个版本。“回归”一词最早由法兰西斯·高尔顿(Francis Galton)所使用。他曾对亲子间的身高做研究,发现父母的身高虽然会遗传给子女,但子女的身高却有逐渐“回归到中等(即人的平均值)”的现象。不过当时的回归和现在的回归在意义上已不尽相同。在1950年代和60年代,经济学家使用机械电子桌面计算器来计算回归。在1970年之前,它有时需要长达24小时从一个回归接收结果。回归模型主要包括以下变量:回归模型将 Y {displaystyle Y} 和一个关于 X {displaystyle mathbf {X} } 和 β {displaystyle beta } 的函数关联起来。在不同的应用领域有各自不同的术语代替这里的“自变量”和“因变量”。这个估计值通常写作: E ( X | Y ) = f ( X , β ) {displaystyle E(X|Y)=f(mathbf {X} ,{boldsymbol {beta }})} 。在进行回归分析时,函数 f {displaystyle f} 的形式必须预先指定。有时函数 f {displaystyle f} 的形式是在对 Y {displaystyle Y} 和 X {displaystyle mathbf {X} } 关系的已有知识上建立的,而不是在数据的基础之上。如果没有这种已有知识,那么就要选择一个灵活和便于回归的 f {displaystyle f} 的形式。假设现在未知向量 β {displaystyle beta } 的维数为k。为了进行回归分析,必须要先有关于 Y {displaystyle Y} 的信息:在最后一种情况下,回归分析提供了一种完成以下任务的工具: ⒈找出一个未知量 β {displaystyle beta } 的解使因变量 Y {displaystyle Y} 的预测值和实际值差别最小(又称最小二乘法)。⒉在特定统计假设下,回归分析使用数据中的多余信息给出关于因变量 Y {displaystyle Y} 和未知量 β {displaystyle beta } 之间的关系。简单线性回归(英语:Simple linear regression)(英语:simple linear regression)复回归分析(英语:multiple regression analysis)是简单线性回归的一种延伸应用,用以了解一个依变项与两组以上自变项的函数关系。对数线性回归(英语:Log-linear model)(英语:Log-linear model),是将解释变项(实验设计中的自变项)和反应变项(实验设计中的依变项)都取对数值之后再进行线性回归,所以依据解释变项的数量,可能是对数简单线性回归,也可能是对数复回归。对数几率回归(英语:Logistic Regression)偏回归(英语:Partial Regression)(英语:Partial Regression)

相关

  • 听力听觉指声源的振动所引起的声波,通过外耳和中耳组成的传音系统传递到内耳,经内耳的环能作用将声波的机械能转变为听觉神经上的神经冲动,后者传送到大脑皮层听觉中枢而产生的主观
  • 叙任权斗争叙任权斗争(英语:Investiture Controversy)或叙任权争夺(英语:Investiture Contest)是中世纪欧洲最著名的重大冲突事件,矛盾的双方是教会和世俗君主。在11和12世纪之际,数位教宗挑战
  • 刺尾鱼毒素刺尾鱼毒素(英语:Maitotoxin,简称MTX)是一种由甲藻门中的岗比甲藻(Gambierdiscus toxicus)产生的剧毒物质。这种化合物是目前人类发现的毒性最强的非蛋白质类毒素:对小鼠的LD50仅为
  • 危险象形符号图危险的象形图是国际全球化学品统一分类和标签制度的分类和标签制度(GHS)一部分。全球统一制度包含两组集合象形符号:一组标签的集装箱和用于工作场所的危险警告,另一组使用的运
  • 认知功能障碍发展障碍、发展迟缓(Developmental disorders),也称心理发展障碍,是一类儿童学习障碍和相关的发育障碍的总称。其包含特殊性发育障碍和广泛性发育障碍。该自闭症关联团体组织的
  • 己部,为汉字索引里为部首之一,康熙字典214个部首中的第四十九个(三划的则为第二十个)。就繁体和简体中文中,己部归于三划部首。己部通常是从上、下、右方及中间均可为部字,它亦可
  • 普罗旺斯-阿尔卑斯br /-蓝色海岸普罗旺斯-阿尔卑斯-蓝色海岸(法语:Provence-Alpes-Côte d'Azur)是法国东南部的一个大区,南邻地中海。面积31,400平方公里,人口4,506,151人。下辖上普罗旺斯阿尔卑斯省(04)、上阿尔
  • 季节季节是每年循环出现的地理景观相差比较大的几个时间段。不同的地区,其季节的划分也是不同的。对温带地区而言,一年分为四季,即春季、夏季、秋季、冬季;而对于赤道地区只有旱季和
  • 聚落聚落,为人民聚居的地方,约分为“都市聚落”(城市)和“乡村聚落”(村落)。聚落多用作人类社会的早期进入定居生活以后,集中居住的区域。考古学上常指早期人类集中居住地域。部落,为部
  • 天宝·葛兰汀泰普·葛兰汀(Temple Grandin,1947年8月29日-),是美国畜产学学者、畅销作家、和禽畜动物行为顾问,目前任教于科罗拉多州立大学。身为知名的高功能自闭症患者,葛兰汀致力于宣导自闭