回归分析

✍ dations ◷ 2025-12-02 01:11:07 #回归分析
回归分析(英语:Regression Analysis)是一种统计学上分析数据的方法,目的在于了解两个或多个变量间是否相关、相关方向与强度,并建立数学模型以便观察特定变量来预测研究者感兴趣的变量。更具体的来说,回归分析可以帮助人们了解在只有一个自变量变化时因变量的变化量。一般来说,通过回归分析我们可以由给出的自变量估计因变量的条件期望。回归分析是建立因变量 Y {displaystyle Y} (或称依变量,反因变量)与自变量 X {displaystyle X} (或称独变量,解释变量)之间关系的模型。简单线性回归使用一个自变量 X {displaystyle X} ,复回归使用超过一个自变量( X 1 , X 2 . . . X i {displaystyle X_{1},X_{2}...X_{i}} )。回归的最早形式是最小二乘法,由1805年的勒让德(Legendre),和1809年的高斯(Gauss)出版。勒让德和高斯都将该方法应用于从天文观测中确定关于太阳的物体的轨道(主要是彗星,但后来是新发现的小行星)的问题。 高斯在1821年发表了最小二乘理论的进一步发展,包括高斯-马尔可夫定理的一个版本。“回归”一词最早由法兰西斯·高尔顿(Francis Galton)所使用。他曾对亲子间的身高做研究,发现父母的身高虽然会遗传给子女,但子女的身高却有逐渐“回归到中等(即人的平均值)”的现象。不过当时的回归和现在的回归在意义上已不尽相同。在1950年代和60年代,经济学家使用机械电子桌面计算器来计算回归。在1970年之前,它有时需要长达24小时从一个回归接收结果。回归模型主要包括以下变量:回归模型将 Y {displaystyle Y} 和一个关于 X {displaystyle mathbf {X} } 和 β {displaystyle beta } 的函数关联起来。在不同的应用领域有各自不同的术语代替这里的“自变量”和“因变量”。这个估计值通常写作: E ( X | Y ) = f ( X , β ) {displaystyle E(X|Y)=f(mathbf {X} ,{boldsymbol {beta }})} 。在进行回归分析时,函数 f {displaystyle f} 的形式必须预先指定。有时函数 f {displaystyle f} 的形式是在对 Y {displaystyle Y} 和 X {displaystyle mathbf {X} } 关系的已有知识上建立的,而不是在数据的基础之上。如果没有这种已有知识,那么就要选择一个灵活和便于回归的 f {displaystyle f} 的形式。假设现在未知向量 β {displaystyle beta } 的维数为k。为了进行回归分析,必须要先有关于 Y {displaystyle Y} 的信息:在最后一种情况下,回归分析提供了一种完成以下任务的工具: ⒈找出一个未知量 β {displaystyle beta } 的解使因变量 Y {displaystyle Y} 的预测值和实际值差别最小(又称最小二乘法)。⒉在特定统计假设下,回归分析使用数据中的多余信息给出关于因变量 Y {displaystyle Y} 和未知量 β {displaystyle beta } 之间的关系。简单线性回归(英语:Simple linear regression)(英语:simple linear regression)复回归分析(英语:multiple regression analysis)是简单线性回归的一种延伸应用,用以了解一个依变项与两组以上自变项的函数关系。对数线性回归(英语:Log-linear model)(英语:Log-linear model),是将解释变项(实验设计中的自变项)和反应变项(实验设计中的依变项)都取对数值之后再进行线性回归,所以依据解释变项的数量,可能是对数简单线性回归,也可能是对数复回归。对数几率回归(英语:Logistic Regression)偏回归(英语:Partial Regression)(英语:Partial Regression)

相关

  • 症状人体解剖学 - 人体生理学 组织学 - 胚胎学 人体寄生虫学 - 免疫学 病理学 - 病理生理学 细胞学 - 营养学 流行病学 - 药理学 - 毒理学症状(英语:symptom)又称病状,医学术语,在疾
  • 固氮作用固氮作用(英语:Nitrogen fixation),简称固氮,指将空气中游离态的氮(氮气)转化为含氮化合物(如硝酸盐、氨、二氧化氮)的过程。可分为自然固氮以及人工固氮两种。自然固氮(Natural nitro
  • 胰脏炎胰脏炎(英语:Pancreatitis)也称为胰腺炎,指的是胰脏的发炎。胰脏是身体里的一个大型器官,位置在胃后方,功能有分泌消化酵素等等。 胰脏炎有两种,分别是急性(英语:Acute_pancreatitis)
  • 类风湿性关节炎类风湿性关节炎(英文:rheumatoid arthritis,简称RA),是一个主要影响关节的长期持续性疾病。它通常导致关节发热、肿胀和疼痛。疼痛和僵硬往往于休息后更恶化。最常见的是手腕和手
  • 结核 (地质学)结核(Concretion)在地质学中,指在沉积岩或土壤中与周边环境成分有明显区别的某种矿物团块。其形状有球形、卵形及各种不规则形状。内部构造式样很多,有同心圆状、放射状等。大小
  • 铜绿假单胞菌绿脓杆菌,又称铜绿假单胞菌(学名:Pseudomonas aeruginosa),是一种革兰氏阴性菌、好氧、呈长棒形的细菌,只有单向的运动性。它是一种机会性感染细菌,且对植物亦是机会性感染的。与其
  • H1N2H1N2亚型(influenza A virus subtype H1N2)是甲型流感病毒的一种。近年来在人类和猪之间引起瘟疫。H1N1、H1N2、H3N2是已知的现代人类间流行的流感病毒。此亚型与其他亚型相比
  • 发光二极管发光二极管(英语:Light-emitting diode,缩写为LED)是一种能发光的半导体电子元件,透过三价与五价元素所组成的复合光源。此种电子元件早在1962年出现,早期只能够发出低光度的红光,
  • 核裂变核裂变(德语:Kernspaltung;英语:nuclear fission),在港台称作核分裂,是指由较重的(原子序数较大的)原子,主要是指铀或钚,裂变成较轻的(原子序数较小的)原子的一种核反应或放射性衰变形式
  • 心指数心指数 (英语:cardiac index,简称CI)是血流动力学(英语:haemodynamic)中涉及参数的以体表面积(BSA)所计算的每分钟左心室心输出量(英语:cardiac output)(CO),从而比较不同个体之间的心泵