马哈拉诺比斯距离

✍ dations ◷ 2025-02-25 09:06:39 #多变量统计

马哈拉诺比斯距离是由印度统计学家马哈拉诺比斯 (英语)提出的,表示数据的协方差距离。它是一种有效的计算两个未知样本集的相似度的方法。与欧氏距离不同的是它考虑到各种特性之间的联系(例如:一条关于身高的信息会带来一条关于体重的信息,因为两者是有关联的)并且是尺度无关的(scale-invariant),即独立于测量尺度。对于一个均值为 μ = ( μ 1 , μ 2 , μ 3 , , μ p ) T {\displaystyle \mu =(\mu _{1},\mu _{2},\mu _{3},\dots ,\mu _{p})^{T}}

其中 σ i {\displaystyle \sigma _{i}} x i {\displaystyle x_{i}} 的标准差。

马哈拉诺比斯距离是基于样本分布的一种距离。物理意义就是在规范化的主成分空间中的欧氏距离。所谓规范化的主成分空间就是利用主成分分析对一些数据进行主成分分解。再对所有主成分分解轴做归一化,形成新的坐标轴。由这些坐标轴张成的空间就是规范化的主成分空间。

换句话说,主成分分析就是把椭球分布的样本改变到另一个空间里,使其成为球状分布。而马哈拉诺比斯距离就是在样本呈球状分布的空间里面所求得的欧式距离。

当然,上面的解释只是对椭球分布而言,对一般分布,只能消除分布的二阶相关性,而不能消除高阶相关性。

相关

  • UML统一建模语言(英语:Unified Modeling Language,缩写 UML)是非专利的第三代建模和规约语言。UML是一种开放的方法,用于说明、可视化、构建和编写一个正在开发的、面向对象的、软件
  • 杭爱山杭爱山(蒙古语:.mw-parser-output .font-mong{font-family:"Menk Hawang Tig","Menk Qagan Tig","Menk Garqag Tig","Menk Har_a Tig","Menk Scnin Tig","Oyun Gurban Ulus Ti
  • 戈壁鸟戈壁鸟(学名Gobipteryx)是反鸟亚纲下上白垩纪的一属鸟类。它的化石在蒙古戈壁沙漠的巴鲁恩戈约特组发现,首次于1976年根据两个头颅骨碎片(编号ZPAL-MgR-I/12及ZPAL-MgR-I/32)而描
  • 重庆北温泉重庆市北温泉风景区位于重庆市北碚区嘉陵江小三峡温汤峡畔,缙云山麓。是中国开发利用最早、至今仍在使用的温泉之一。1982年被中国国务院批准定为中国首批国家级风景名胜区之
  • 张仃张仃(1917年5月19日-2010年2月21日),号它山,男,辽宁黑山人,中国现代艺术家、教育家、清华大学教授、原中央工艺美术学院院长,中国人民政治协商会议会徽的设计者,中华人民共和国国徽设
  • 意诺增爵十三世教宗意诺增爵十三世(拉丁语:Innocentius PP. XIII;1655年5月13日-1724年3月7日)原名弥额尔-安杰洛·孔蒂(Michelangelo Conti),1721年5月8日当选罗马主教,同年5月18日即位至1724年3月
  • 刚力彩芽刚力彩芽(1992年8月27日-),日本演员、歌手及模特儿。出身于神奈川县横滨市,身高162公分,血型O型。※粗体为主演。※粗体为主演。※粗体为主演。※粗体为主演。※粗体为主演。
  • 理查德·科恩理查德·科恩(德语:Richard Kohn,1888年2月27日-1963年)是一名已故奥地利足球运动员及教练,曾先后执教于拜仁慕尼黑,巴塞罗那和费耶诺德等球队。
  • 任德芬任德芬(法语:Léon-Ignace Mangin,1857年7月30日-1900年7月20日)罗马天主教传教士、耶稣会会士,1900年庚子事变中,在河北景县朱家河殉道。1857年7月30日,任德芬出生于法国洛林地区摩
  • 小行星7148小行星7148(英语:7148 Reinholdbien)是一颗围绕太阳公转的小行星。1971年3月25日,C. J. 万·豪敦、I. 万·豪敦-格勒内费尔德、T. 赫雷尔斯在帕洛马山发现了此天体。这颗小行星