马哈拉诺比斯距离

✍ dations ◷ 2025-04-03 12:19:44 #多变量统计

马哈拉诺比斯距离是由印度统计学家马哈拉诺比斯 (英语)提出的,表示数据的协方差距离。它是一种有效的计算两个未知样本集的相似度的方法。与欧氏距离不同的是它考虑到各种特性之间的联系(例如:一条关于身高的信息会带来一条关于体重的信息,因为两者是有关联的)并且是尺度无关的(scale-invariant),即独立于测量尺度。对于一个均值为 μ = ( μ 1 , μ 2 , μ 3 , , μ p ) T {\displaystyle \mu =(\mu _{1},\mu _{2},\mu _{3},\dots ,\mu _{p})^{T}}

其中 σ i {\displaystyle \sigma _{i}} x i {\displaystyle x_{i}} 的标准差。

马哈拉诺比斯距离是基于样本分布的一种距离。物理意义就是在规范化的主成分空间中的欧氏距离。所谓规范化的主成分空间就是利用主成分分析对一些数据进行主成分分解。再对所有主成分分解轴做归一化,形成新的坐标轴。由这些坐标轴张成的空间就是规范化的主成分空间。

换句话说,主成分分析就是把椭球分布的样本改变到另一个空间里,使其成为球状分布。而马哈拉诺比斯距离就是在样本呈球状分布的空间里面所求得的欧式距离。

当然,上面的解释只是对椭球分布而言,对一般分布,只能消除分布的二阶相关性,而不能消除高阶相关性。

相关

  • 人均国民生产总值国民生产总值(英语:Gross National Product,缩写:GNP),台湾亦称国民生产毛额,在描述地区性生产时称本地居民生产总值或地区居民生产总值,即某一区域公民一年内所生产的最终产品(包括
  • 激活产物激活产物(Activation products)又称为活化产物,是经中子活化后变得具有放射性的物质,比如核反应堆和原子弹中的结构材料,反应堆的冷却剂,控制棒以及其他中子毒物。这些活化产物必
  • 六河六河国家森林(英语:Six Rivers National Forest)是座美国国家森林,位于加利福尼亚州西北角。森林于1947年6月3日由时任美国总统的哈里·S·杜鲁门设立,从克来麦斯国家森林、锡斯
  • 赖利·佩吉劳伦斯·爱德华·“拉里”·佩奇(英语:Lawrence Edward Larry Page,1973年3月26日-),美国计算机科学家和互联网企业家,1998年拉里佩奇与谢尔盖·布林创造了Google。Google公司是Al
  • 蟹黄汤包蟹黄汤包为江苏传统美食,明、清时期已经享有盛誉。其特色是皮薄如纸,以制作"绝"、形态"美"、吃法"奇"出名。蟹黄汤包的制作原料为螃蟹的蟹黄和蟹肉,汤为原味鸡汤。其中龙袍蟹黄
  • 亚历山大·汤斯曼亚历山大·汤斯曼(波兰语:Alexandre Tansman,1897年6月12日-1986年11月15日),犹太血统的法籍波兰作曲家,钢琴家。早年在华沙学习,一战后迁居巴黎,长期以钢琴家身份活动并谱写电影配乐
  • 德氏六线风鸟 Rothschild, 1900德氏六线风鸟(英文:Duivenbode's six-wired bird of paradise)是一种极乐鸟,是阿法六线风鸟(英语:Parotia sefilata)()与华美风鸟()的属间混种。其名字是为了纪念Maar
  • 小店镇 (博野县)小店镇,是中华人民共和国河北省保定市博野县下辖的一个乡镇级行政单位。小店镇下辖以下地区:小店村、西杜村、东杜村、闫庄村、谭庄村、周于庄村、吴王庄村、魏庄村、肖庄村、
  • 古斯塔夫·卡耶博特古斯塔夫·卡耶博特(Gustave Caillebotte,1848年8月19日-1894年2月21日),法国印象派画家。他描绘了许多从室内窗边眺望窗外或巴黎街景的人物,例如《室内》,站在窗边的女性,背向着观
  • 范世矜范世矜(越南语:Phạm Thế Căng/.mw-parser-output .han-nom{font-family:"Nom Na Tong","Han-Nom Gothic","Han-Nom Ming","HAN NOM A","HAN NOM B","Ming-Lt-HKSCS-UNI-H","