马哈拉诺比斯距离

✍ dations ◷ 2025-06-08 09:08:16 #多变量统计

马哈拉诺比斯距离是由印度统计学家马哈拉诺比斯 (英语)提出的,表示数据的协方差距离。它是一种有效的计算两个未知样本集的相似度的方法。与欧氏距离不同的是它考虑到各种特性之间的联系(例如:一条关于身高的信息会带来一条关于体重的信息,因为两者是有关联的)并且是尺度无关的(scale-invariant),即独立于测量尺度。对于一个均值为 μ = ( μ 1 , μ 2 , μ 3 , , μ p ) T {\displaystyle \mu =(\mu _{1},\mu _{2},\mu _{3},\dots ,\mu _{p})^{T}}

其中 σ i {\displaystyle \sigma _{i}} x i {\displaystyle x_{i}} 的标准差。

马哈拉诺比斯距离是基于样本分布的一种距离。物理意义就是在规范化的主成分空间中的欧氏距离。所谓规范化的主成分空间就是利用主成分分析对一些数据进行主成分分解。再对所有主成分分解轴做归一化,形成新的坐标轴。由这些坐标轴张成的空间就是规范化的主成分空间。

换句话说,主成分分析就是把椭球分布的样本改变到另一个空间里,使其成为球状分布。而马哈拉诺比斯距离就是在样本呈球状分布的空间里面所求得的欧式距离。

当然,上面的解释只是对椭球分布而言,对一般分布,只能消除分布的二阶相关性,而不能消除高阶相关性。

相关

  • 水生栖热菌水生栖热菌(Thermus aquaticus)是一种嗜热细菌,其DNA聚合酶——Taq酶被全世界的分子生物学实验室广泛应用于聚合酶链式反应(PCR)。
  • 布林迪西布林迪西(意大利语:Brindisi)是意大利普利亚大区布林迪西省的首府,面积328平方公里,人口90,175人(2007年)。布林迪西在古时是希腊人的殖民地,当时古希腊人在此地定居。至公元前267年
  • 雷州片雷州话,又称雷话,为汉藏语系汉语族闽语的一个方言,为雷州民系的母语,现主要通行于广东省雷州半岛的雷州、徐闻、遂溪南部、电白部分乡镇等地。雷州民系把自己当地的雷州话称为黎
  • 2009年迈克尔·杰克逊之死阴谋论2009年6月25日,迈克尔·杰克逊在他位于洛杉矶荷尔贝山(英语:Holmby Hills, Los Angeles)租赁的住处逝世。他的私人医生康拉德·墨瑞曾试图急救但没有成功。洛杉矶消防队(英语:Los
  • NHK综合频道NHK综合频道(日语:NHK総合テレビジョン,英语译名:),又译为NHK综合电视台、NHK综合台,为日本放送协会(NHK)的无线电视频道之一,简称“NHK G”或“GTV”(台标显示为“NHKG”),识别呼号为JOA
  • 武内宿祢武内宿祢(日语:武内宿禰/たけのうち の すくね/たけうち の すくね/たけち の すくね ,84年?-367年?)也作建内宿祢,根据《古事记》和《日本书纪》的说法,是倭朝廷初期的一位大臣。他
  • 屈之乘屈之乘(1567年-1626年),字锺湘,湖广零陵县人,明朝政治人物。万历二十年(1592年)壬辰科第三甲第一百四十二名进士。仕至工部员外。
  • 唱响星途《唱响星途》(Sing Tour)是澳大利亚申亿传媒(WZ Media)主办的全球华人流行歌手大赛,自2017年首季举办以来,每一季《唱响星途》都在包括中国和澳大利亚在内的全球赛区进行华语流行
  • 2014年以巴冲突哈马斯及加沙地带胜利,成功击退以色列军队,达成停火协议加沙武装组织本雅明·内塔尼亚胡 以色列总理 摩西·亚阿隆 以色列国防部 本尼·甘茨 以色列国防军 Amir Eshel(英语:Amir
  • 紫锦鱼紫锦鱼,又称紫衣叶鲷,俗名四齿、砾仔、紫衣、猫仔鱼、汕冷仔为辐鳍鱼纲鲈形目隆头鱼亚目隆头鱼科的其中一种。本鱼印度太平洋区,包括红海、东非、南非、马达加斯加、科摩罗共和