马哈拉诺比斯距离

✍ dations ◷ 2025-12-06 08:42:25 #多变量统计

马哈拉诺比斯距离是由印度统计学家马哈拉诺比斯 (英语)提出的,表示数据的协方差距离。它是一种有效的计算两个未知样本集的相似度的方法。与欧氏距离不同的是它考虑到各种特性之间的联系(例如:一条关于身高的信息会带来一条关于体重的信息,因为两者是有关联的)并且是尺度无关的(scale-invariant),即独立于测量尺度。对于一个均值为 μ = ( μ 1 , μ 2 , μ 3 , , μ p ) T {\displaystyle \mu =(\mu _{1},\mu _{2},\mu _{3},\dots ,\mu _{p})^{T}}

其中 σ i {\displaystyle \sigma _{i}} x i {\displaystyle x_{i}} 的标准差。

马哈拉诺比斯距离是基于样本分布的一种距离。物理意义就是在规范化的主成分空间中的欧氏距离。所谓规范化的主成分空间就是利用主成分分析对一些数据进行主成分分解。再对所有主成分分解轴做归一化,形成新的坐标轴。由这些坐标轴张成的空间就是规范化的主成分空间。

换句话说,主成分分析就是把椭球分布的样本改变到另一个空间里,使其成为球状分布。而马哈拉诺比斯距离就是在样本呈球状分布的空间里面所求得的欧式距离。

当然,上面的解释只是对椭球分布而言,对一般分布,只能消除分布的二阶相关性,而不能消除高阶相关性。

相关

  • 食品辐照食品辐照(Food irradiation),亦称“食品照射”或“电离辐射灭菌”,指将食物暴露在游离辐射(ionizing radiation)下。此过程可以灭除食物上的微生物、细菌、病毒或微小虫类。其他的
  • 柚木柚木(学名Tectona grandis)又名胭脂树,是阔叶乔木,属于唇形科(或是马鞭草科)柚木属的植物。一般生长在南亚或东南亚,以缅甸(Burma Teak)出产的最为著名,原产地为缅甸 (Kyun)、印尼(T
  • 维索基纳州维索基纳州 (捷克语:Kraj Vysočina),是捷克的一个州,历史上属于波希米亚的东南部和摩拉维亚西南部的一部分。面积6,925 平方公里,人口510,767 (2006年)。首府伊赫拉瓦。下分五
  • 猫的报恩猫的报恩电影海报《猫的报恩》(日语:猫の恩返し,中国大陆、台湾、新加坡译作《猫的报恩》,港澳地区译作《猫之报恩》)是吉卜力工作室2002年推出的一部动画电影,片名叫做《猫的报恩
  • 信托银行大厦信托银行大厦(南非语:Trust Bank Gebou,英语:Trust Bank Building)是南非约翰内斯堡中心商业区(英语:Johannesburg CBD)的一座摩天大楼。其建于1970年,高度为140米(460英尺)。该大厦是
  • 簇花草科簇花草科(学名:Cytinaceae)又名岩寄生科,是一类寄生植物,只包括两属约10种。以前的分类法将其列入大花草科,属于金虎尾目,但后来的研究认为应该单独列为一个科,分到锦葵目。不过根据
  • 初香山初香山(?年-?年)。山东省莱阳县人。民国37年(1948年)在山东省第四选区当选第一届立法委员。
  • 韩鹏飞 (演员)韩鹏飞(1992年-)出生于河北省邯郸市临漳县临漳镇西南角村,豫剧演员。2008年9月参加河南电视台梨园春并夺得年度总冠军,之后便小有名气。先后就读于邯郸市第四中学和中国戏曲学院
  • 法兰西斯·鲍斯·塞尔法兰西斯·鲍斯·塞尔(英文:Francis Bowes Sayre Sr.,(1885年4月30日-1972年3月29日),是美国政治人物兼教育家,为前菲律宾高级专员以及前哈佛法学院教授,同时为美国前总统伍德罗·威
  • 科比特峰科比特峰(英语:Corbet Peak),是南极洲的山峰,位于埃尔斯沃思地,属于埃尔斯沃思山脉中森蒂纳尔岭的一部分,处于温森高原北侧,海拔高度4,822米,现时由南极条约体系管理。坐标:78°31′31