马哈拉诺比斯距离

✍ dations ◷ 2025-11-25 04:31:46 #多变量统计

马哈拉诺比斯距离是由印度统计学家马哈拉诺比斯 (英语)提出的,表示数据的协方差距离。它是一种有效的计算两个未知样本集的相似度的方法。与欧氏距离不同的是它考虑到各种特性之间的联系(例如:一条关于身高的信息会带来一条关于体重的信息,因为两者是有关联的)并且是尺度无关的(scale-invariant),即独立于测量尺度。对于一个均值为 μ = ( μ 1 , μ 2 , μ 3 , , μ p ) T {\displaystyle \mu =(\mu _{1},\mu _{2},\mu _{3},\dots ,\mu _{p})^{T}}

其中 σ i {\displaystyle \sigma _{i}} x i {\displaystyle x_{i}} 的标准差。

马哈拉诺比斯距离是基于样本分布的一种距离。物理意义就是在规范化的主成分空间中的欧氏距离。所谓规范化的主成分空间就是利用主成分分析对一些数据进行主成分分解。再对所有主成分分解轴做归一化,形成新的坐标轴。由这些坐标轴张成的空间就是规范化的主成分空间。

换句话说,主成分分析就是把椭球分布的样本改变到另一个空间里,使其成为球状分布。而马哈拉诺比斯距离就是在样本呈球状分布的空间里面所求得的欧式距离。

当然,上面的解释只是对椭球分布而言,对一般分布,只能消除分布的二阶相关性,而不能消除高阶相关性。

相关

  • 技术就绪指数技术就绪指数(Technology Readiness Level,TRL)也称为技术备便水准,是一种衡量技术发展(包括材料、零件、设备等)成熟度的指标,为部分美国联邦政府的机构及国际性公司所使用,在应用
  • 乙醇 (药物)酒精(Alcohol)有时也称为乙醇,是一种精神药物,也是酒类饮料(例如啤酒及葡萄酒)及蒸馏酒中的活性成分。是年代最早,也是最常见的娱乐性用药,过度饮用会出现酒精中毒(酒醉)的症状。酒精
  • 连二硫酸连二硫酸(H2S2O6)是一种只能在溶液中存在的化合物。连二硫酸是一种较稳定的强酸。室温下,稀的连二硫酸溶液较稳定。溶液被浓缩或者受热时,缓慢歧化分解为硫酸和二氧化硫:连二硫酸
  • Cyrix Cx486DLCCyrix Cx486DLC,是Cyrix早期的486级CPU,Cyrix希望它能够和英代尔486SX与DX竞争。为Cyrix制造486DLC的德州仪器后来发布了它自己的版本,型号为TI-486SXL,并在新版本中将Cyrix原设
  • 丹杨郡丹杨郡,中国古代的郡。西汉改鄣郡置。秦置鄣郡(一说名为故鄣郡),治故鄣县(今浙江安吉县西北)。辖境约今江苏省长江以南,安徽省水阳江流域以东,江苏省茅山、浙江省天目山以西和安徽、
  • 菲律宾狭瓣苔菲律宾狭瓣苔(学名:)是苔纲叶苔目歧舌苔科狭瓣苔属之下的一个物种。在2007年之前,本物种被认为是大歧舌苔的亚种;其后独立成单一物种。见于琉球群岛、苏门答腊岛、爪哇岛、菲律宾
  • 钱锺韩钱锺韩(1911年6月2日-2002年2月8日),江苏无锡人,中国工程热物理和自动化专家,中国机电结合的动力工程学科的创建者。钱锺韩1927年7月毕业于无锡辅仁中学。1933年7月毕业于交通大学
  • 哈比人电影系列原创人物列表本列表列出了彼得·杰克逊改编自托尔金小说的电影《哈比人电影系列》里的原创角色。艾弗德·里斯贝(Alfrid Lickspittle ),由莱恩·盖吉饰演。是长湖镇镇长的副手兼仆人,性格怯
  • 猿面天蛾猿面天蛾(学名:)是鳞翅目天蛾科的一种,成虫翅长48毫米,体长55毫米。头部黄褐色,复眼较大,黑色。胸部肩板赭黄色,胸部背面白色间杂有灰色毛,下方有弯月形眉纹及由黑蓝色相间的色斑组成
  • 辛海棉辛海棉枢机(英语:Cardinal Jaime Lachica Sin,1928年8月31日-2005年6月21日)是天主教枢机和前天主教马尼拉总教区总主教。他被认为是菲律宾的两次社会运动-第一次和第二次的“人民