马哈拉诺比斯距离

✍ dations ◷ 2025-11-21 19:21:52 #多变量统计

马哈拉诺比斯距离是由印度统计学家马哈拉诺比斯 (英语)提出的,表示数据的协方差距离。它是一种有效的计算两个未知样本集的相似度的方法。与欧氏距离不同的是它考虑到各种特性之间的联系(例如:一条关于身高的信息会带来一条关于体重的信息,因为两者是有关联的)并且是尺度无关的(scale-invariant),即独立于测量尺度。对于一个均值为 μ = ( μ 1 , μ 2 , μ 3 , , μ p ) T {\displaystyle \mu =(\mu _{1},\mu _{2},\mu _{3},\dots ,\mu _{p})^{T}}

其中 σ i {\displaystyle \sigma _{i}} x i {\displaystyle x_{i}} 的标准差。

马哈拉诺比斯距离是基于样本分布的一种距离。物理意义就是在规范化的主成分空间中的欧氏距离。所谓规范化的主成分空间就是利用主成分分析对一些数据进行主成分分解。再对所有主成分分解轴做归一化,形成新的坐标轴。由这些坐标轴张成的空间就是规范化的主成分空间。

换句话说,主成分分析就是把椭球分布的样本改变到另一个空间里,使其成为球状分布。而马哈拉诺比斯距离就是在样本呈球状分布的空间里面所求得的欧式距离。

当然,上面的解释只是对椭球分布而言,对一般分布,只能消除分布的二阶相关性,而不能消除高阶相关性。

相关

  • 托马斯·布朗托马斯·布朗爵士(Sir Thomas Browne,1605年10月19日-1682年10月19日),英国作家,对医学、宗教、科学和神秘学都有贡献。布朗的作品显示出他对自然世界的强烈兴趣,并且受到培根科学
  • 1910年大火1910年大火(英语:Great Fire of 1910,也称为Big Blowup、Big Burn或Devil's Broom fire)是美国的一场野火事故,燃烧面积达3 × 106英亩(12,000平方千米),发生地点位于华盛顿州东北
  • Ernst Haeckel恩斯特·海因里希·菲利普·奥古斯特·海克尔(Ernst Heinrich Philipp August Haeckel,1834年2月16日-1919年8月9日)生于波茨坦卒于耶拿,德国生物学家、博物学家、哲学家、艺术家
  • 沈刚伯沈刚伯(1896年12月4日-1977年7月31日),中华民国历史学家。湖北宜昌三斗坪人。自幼受留日归国的父亲沈莘庵教诲,读毕《左传》、《国语》、《国策》、《国礼》、《礼记》后,于11岁,19
  • 也拉府 small(惹拉府)/small也拉府(泰语:จังหวัดยะลา,皇家转写:Changwat Yala,泰语发音:),是位于泰国最南部的一个府,也是泰南一个不甚安宁的府份。当地华人称其为惹拉府。首府为也拉(惹拉)。也拉府位
  • 同致癌物同致癌物(英语:Co-carcinogen),亦称作助长物(英语:Promoter),为有助于癌细胞行成之作用者,有些致癌物不直接与DNA发生作用,而是透过不同的途径而引发恶性肿瘤,这些原发性的致癌含助长癌
  • 野口勇野口勇(英语:Isamu Noguchi,日语:イサム・ノグチ,1904年11月17日-1988年12月30日),20世纪美国艺术家。对今日的公共花园和景观雕塑有很大的影响。野口勇出生在美国的洛杉矶,母亲是美
  • 阮劢阮劢(越南语:Nguyễn Mại/.mw-parser-output .han-nom{font-family:"Nom Na Tong","Han-Nom Gothic","Han-Nom Ming","HAN NOM A","HAN NOM B","Ming-Lt-HKSCS-UNI-H","Ming-L
  • 英国皇家经济学会英国皇家经济学会(英语:Royal Economic Society,缩写为 RES),英国的职业团体,以推动经济学研究为其宗旨。它的前身是1890年建立的英国经济学协会(British Economic Association),在19
  • Ki-67Ki-67可以是指: