马哈拉诺比斯距离

✍ dations ◷ 2025-11-22 21:36:02 #多变量统计

马哈拉诺比斯距离是由印度统计学家马哈拉诺比斯 (英语)提出的,表示数据的协方差距离。它是一种有效的计算两个未知样本集的相似度的方法。与欧氏距离不同的是它考虑到各种特性之间的联系(例如:一条关于身高的信息会带来一条关于体重的信息,因为两者是有关联的)并且是尺度无关的(scale-invariant),即独立于测量尺度。对于一个均值为 μ = ( μ 1 , μ 2 , μ 3 , , μ p ) T {\displaystyle \mu =(\mu _{1},\mu _{2},\mu _{3},\dots ,\mu _{p})^{T}}

其中 σ i {\displaystyle \sigma _{i}} x i {\displaystyle x_{i}} 的标准差。

马哈拉诺比斯距离是基于样本分布的一种距离。物理意义就是在规范化的主成分空间中的欧氏距离。所谓规范化的主成分空间就是利用主成分分析对一些数据进行主成分分解。再对所有主成分分解轴做归一化,形成新的坐标轴。由这些坐标轴张成的空间就是规范化的主成分空间。

换句话说,主成分分析就是把椭球分布的样本改变到另一个空间里,使其成为球状分布。而马哈拉诺比斯距离就是在样本呈球状分布的空间里面所求得的欧式距离。

当然,上面的解释只是对椭球分布而言,对一般分布,只能消除分布的二阶相关性,而不能消除高阶相关性。

相关

  • 肝功能测试肝功能测试是为了解病患肝脏的状态,设计而成的临床生化学实验室血液检测方法的总称。相关测试参数包括:PT/INR(凝血酶原时间/国际标准化比值)、aPTT、白蛋白、胆红素(直接和间接)、
  • RPGN急进性肾小球肾炎(英语:Rapidly progressive glomerulonephritis (RPGN))是一种以急进性肾炎综合征为临床特征,以新月体性肾小球肾炎为病理特征的一类疾病。为新月体性肾小球肾
  • 东哥特人东哥特人(Ostrogoths),港、台译作东哥德人,是哥特人的一个分支,3世纪时曾在黑海北边建立一个帝国。5世纪末在意大利建立东哥特王国。东哥特人自波罗的海地区向南扩张,建起一个其幅
  • 纵隔腔纵膈(mediastinum)是描述胸腔中心为疏松结缔组织所包围的构造,并无一个明显的界限。本区域包含许多解剖构造,包含心脏及其周围血管系统、食道、气管、膈神经(英语:phrenic nerve)、
  • 爱努语阿伊努语(阿伊努语假名:.mw-parser-output .jis2004font{font-family:"源ノ角ゴシック JP Normal","源ノ角ゴシック JP","Source Han Sans Normal","Source Han Sans","NotoSa
  • 芝加哥商品交易所芝加哥期货交易所(英文:Chicago Board of Trade,缩写:CBOT)是美国芝加哥的期货交易所,成立于1848年是世界上最古老的期货和期权交易所。旗下有50种以上期货和期权产品总计3600个项
  • 尤里安·康斯坦丁诺维奇·舒茨基尤里安·康斯坦丁诺维奇·舒茨基( Юлиан Константинович Шуцкий ,1897年8月11日-1938年2月18日),为一俄罗斯语言学家、汉学家、翻译家,教授(1935年)、语言
  • 威廉·莫尔顿·马斯顿查尔斯·莫尔顿 威廉·莫尔顿·马斯顿(英语:William Moulton Marston,1893年5月9日–1947年5月2日),以笔名查尔斯·莫尔顿(英语:Charles Moulton)为人所知,是美国的心理学家、发明家
  • 孟金龙 (公司主席)孟金龙,英文姓名Jinlong Meng1984年出生,现为皇冠环球集团(00727.HK)董事局主席兼首席执行官,持有中国京桥大学工商管理学士学位。他于2012年加入皇冠集团,于加入皇冠集团前从事
  • 罗德里戈·罗哈斯·德·内格里罗德里戈·安德烈斯·罗哈斯·德·内格里(西班牙语:Rodrigo Andrés Rojas de Negri,1967年3月7日-1986年7月6日),是智利的一名摄影师,1973年智利政变后,因为抗议奥古斯托·皮诺切特