马哈拉诺比斯距离

✍ dations ◷ 2025-11-22 01:53:09 #多变量统计

马哈拉诺比斯距离是由印度统计学家马哈拉诺比斯 (英语)提出的,表示数据的协方差距离。它是一种有效的计算两个未知样本集的相似度的方法。与欧氏距离不同的是它考虑到各种特性之间的联系(例如:一条关于身高的信息会带来一条关于体重的信息,因为两者是有关联的)并且是尺度无关的(scale-invariant),即独立于测量尺度。对于一个均值为 μ = ( μ 1 , μ 2 , μ 3 , , μ p ) T {\displaystyle \mu =(\mu _{1},\mu _{2},\mu _{3},\dots ,\mu _{p})^{T}}

其中 σ i {\displaystyle \sigma _{i}} x i {\displaystyle x_{i}} 的标准差。

马哈拉诺比斯距离是基于样本分布的一种距离。物理意义就是在规范化的主成分空间中的欧氏距离。所谓规范化的主成分空间就是利用主成分分析对一些数据进行主成分分解。再对所有主成分分解轴做归一化,形成新的坐标轴。由这些坐标轴张成的空间就是规范化的主成分空间。

换句话说,主成分分析就是把椭球分布的样本改变到另一个空间里,使其成为球状分布。而马哈拉诺比斯距离就是在样本呈球状分布的空间里面所求得的欧式距离。

当然,上面的解释只是对椭球分布而言,对一般分布,只能消除分布的二阶相关性,而不能消除高阶相关性。

相关

  • 美国邮政服务美国邮政总局(英语:United States Postal Service,缩写:USPS),又称美国邮局、美国邮政服务,是美国联邦政府的一个独立机构,是少数在美国宪法中提及设立的机构。邮政总局的历史可上溯
  • 特性函数在概率论中,任何随机变量的特征函数(缩写:ch.f,复数形式:ch.f's)完全定义了它的概率分布。在实直线上,它由以下公式给出,其中X是任何具有该分布的随机变量:其中t是一个实数,i是虚数单
  • P. mallei鼻疽伯克霍尔德氏菌(Burkholderia mallei),又称鼻疽伯克氏菌、鼻疽假单孢菌,一种革兰氏阴性菌,属于伯克氏菌属。它会引起马鼻疽。医学导航:病菌细菌(分类)gr+f/gr+a(t)/gr-p(c/gr-o药物(J1p
  • 东港迎王平安祭典东港迎王平安祭典,东港人称迎王(台罗:Tang-káng ngiâ ông),是台湾屏东县东港镇中一种知名的地方祭典,迎接代天巡狩的五位王爷神(千岁爷),前来扫荡瘟疫、驱除恶灵。台湾民间信仰中,
  • 阿富汗人民民主党总书记阿富汗人民民主党中央委员会总书记是阿富汗人民民主党的最高负责人,总书记也是阿富汗民主共和国作为一党制社会主义国家的党和国家最高领导人。总书记一般兼任国家革命委员会
  • 畜牧业的巨大阴影畜牧业的巨大阴影:环境问题与选择是由联合国粮食及农业组织(FAO)在2006年11月29日所提出的报告书,其内容旨在全面评估畜牧业对于环境的冲击,并寻求技术上与政策上可能的减缓方
  • 挪威诺贝尔研究所坐标:59°54′55.08″N 10°43′19.85″E / 59.9153000°N 10.7221806°E / 59.9153000; 10.7221806挪威诺贝尔研究所(挪威语:Det Norske Nobelinstitutt,英语:Norwegian Nobel I
  • 乔·舒斯特约瑟夫·乔·舒斯特,(英语:Joseph "Joe" Shuster,/ˈʃuːstər/,1914年7月10日-1992年7月30日)是一位加拿大裔美国人,最知名的是和Jerry Siegel共同创造了DC漫画的角色超人。
  • 科姆希尔岭坐标:82°47′S 160°10′E / 82.783°S 160.167°E / -82.783; 160.167科姆希尔岭(英语:Komhyr Ridge)是南极洲的山岭,位于沙克尔顿海岸,属于伊丽莎白女王岭的一部分,处于霍克斯坦
  • 李可李可可以指: