马哈拉诺比斯距离

✍ dations ◷ 2025-12-02 01:53:45 #多变量统计

马哈拉诺比斯距离是由印度统计学家马哈拉诺比斯 (英语)提出的,表示数据的协方差距离。它是一种有效的计算两个未知样本集的相似度的方法。与欧氏距离不同的是它考虑到各种特性之间的联系(例如:一条关于身高的信息会带来一条关于体重的信息,因为两者是有关联的)并且是尺度无关的(scale-invariant),即独立于测量尺度。对于一个均值为 μ = ( μ 1 , μ 2 , μ 3 , , μ p ) T {\displaystyle \mu =(\mu _{1},\mu _{2},\mu _{3},\dots ,\mu _{p})^{T}}

其中 σ i {\displaystyle \sigma _{i}} x i {\displaystyle x_{i}} 的标准差。

马哈拉诺比斯距离是基于样本分布的一种距离。物理意义就是在规范化的主成分空间中的欧氏距离。所谓规范化的主成分空间就是利用主成分分析对一些数据进行主成分分解。再对所有主成分分解轴做归一化,形成新的坐标轴。由这些坐标轴张成的空间就是规范化的主成分空间。

换句话说,主成分分析就是把椭球分布的样本改变到另一个空间里,使其成为球状分布。而马哈拉诺比斯距离就是在样本呈球状分布的空间里面所求得的欧式距离。

当然,上面的解释只是对椭球分布而言,对一般分布,只能消除分布的二阶相关性,而不能消除高阶相关性。

相关

  • 规则致密结缔组织规则致密结缔组织(Dense regular connective tissue,简称DRCT)为人体各组织提供了连接。其纤维大量密集顺应力方向成束平行排列,腱细胞胞体伸出薄翼状突起深入纤维束之间。该组
  • 令牌环令牌环(英语:Token-Ring)又称权标环或權杖環,是定义在IEEE 802.5标准中的一种局域网接入方式。令牌环网络的基本原理是利用令牌(代表发信号的许可)来避免网络中的冲突,它与使用冲突
  • 父母管理训练父母管理训练(英文:Parent Training in Behavior Therapy 、Behavior Management Training for Parents, Parent Behavior Therapy、 Behavioral Parent Training、或 Parent
  • 中东欧中东欧是一个欧洲大陆的地缘政治概念,包括冷战后影响力最大、统一后的德国,受德国影响及冷战时作为中立国的奥地利,冷战时期被苏联所控制的东欧卫星国,波罗的海三国(立陶宛、拉脱
  • 禾部禾部,为汉字索引中的部首之一,康熙字典214个部首中的第一百一十五个(五划的则为第二十一个)。就繁体和简体中文中,禾部归于五划部首。禾部通常从左、上、下方为部字。且无其他部
  • 钱斯医生《钱斯医生》(英语:)是一部美国电视剧,由肯姆·纳恩(英语:Kem Nunn)和艾莉丝珊卓·坎宁汉姆(英语:Alexandra Cunningham)创作,主演是休·劳瑞。本剧改编自纳恩的同名小说。本剧于2016年
  • alt.chinese.textalt.chinese.text是Internet上最早使用中文张贴内容的Usenet新闻组,常缩写为ACT,于1992年6月28日由美国印第安那大学的魏亚桂请该校系统管理员建立,最早的中文电子刊物《华夏文
  • 陕西广播电视台新闻资讯频道陕西广播电视台新闻资讯频道,原名新闻综合频道,该频道于1960年7月1日开播,2012年9月改为现名,该频道是陕西本土第一电视频道。新闻资讯频道由新闻、电视剧和综艺节目三大版块组
  • 冯纽曼熵量子统计力学(英语:Quantum statistical mechanics)中,冯纽曼熵(英语:von Neumann entropy)是经典体系吉布士熵概念的拓展延伸。体系的冯纽曼熵为其中Tr表示求迹(中文:迹),
  • 马克·多蒂马克·多蒂(英语:Mark Doty,1953年8月10日-),美国诗人,生于美国田纳西州玛丽维尔。他先是在德雷克大学获学士学位,后在戈达德学院获艺术硕士学位。作为诗人出道较晚,34岁时出版自己第