马哈拉诺比斯距离

✍ dations ◷ 2024-12-23 04:03:48 #多变量统计

马哈拉诺比斯距离是由印度统计学家马哈拉诺比斯 (英语)提出的,表示数据的协方差距离。它是一种有效的计算两个未知样本集的相似度的方法。与欧氏距离不同的是它考虑到各种特性之间的联系(例如:一条关于身高的信息会带来一条关于体重的信息,因为两者是有关联的)并且是尺度无关的(scale-invariant),即独立于测量尺度。对于一个均值为 μ = ( μ 1 , μ 2 , μ 3 , , μ p ) T {\displaystyle \mu =(\mu _{1},\mu _{2},\mu _{3},\dots ,\mu _{p})^{T}}

其中 σ i {\displaystyle \sigma _{i}} x i {\displaystyle x_{i}} 的标准差。

马哈拉诺比斯距离是基于样本分布的一种距离。物理意义就是在规范化的主成分空间中的欧氏距离。所谓规范化的主成分空间就是利用主成分分析对一些数据进行主成分分解。再对所有主成分分解轴做归一化,形成新的坐标轴。由这些坐标轴张成的空间就是规范化的主成分空间。

换句话说,主成分分析就是把椭球分布的样本改变到另一个空间里,使其成为球状分布。而马哈拉诺比斯距离就是在样本呈球状分布的空间里面所求得的欧式距离。

当然,上面的解释只是对椭球分布而言,对一般分布,只能消除分布的二阶相关性,而不能消除高阶相关性。

相关

  • 比斯开湾坐标:45°30′N 04°20′W / 45.500°N 4.333°W / 45.500; -4.333比斯开湾(西班牙语:Golfo de Vizcaya;法语:Golfe de Gascogne;巴斯克语:Bizkaiko Golkoa)是北大西洋的一个海湾,海
  • 安努安努 (阿卡德语:
  • 1号染色体上1号染色体是人类染色体中最大的一条。如同其他的体染色体,一般人类身体内的细胞中,会有两条1号染色体。在1号染色体,缠绕了大约245,522,847个核苷酸碱基对(DNA的基本讯息单位),大
  • 国际机场协会国际机场协会(英语:Airports Council International;简称:ACI) 成立于1991年,由国际机场协会理事会管理,是全球机场唯一的的贸易代表。主要工作是提高机场的水平,制定标准、政策和
  • 火烧岛《火烧岛》(英文:Island of Fire)为台湾出产的监狱电影作品。学成归国的优秀警官黄伟,为追查杀死未婚妻父亲的凶手,从现场所发现的断指,着手调查凶手身份,但指纹竟属于一位三个月前
  • 视后视后可能是指:对在电视剧集评选活动中获得最佳女主角或最杰出女演员等奖项的女艺人的尊称,也是对这些奖项的俗称。
  • 基督教法西斯主义基督教法西斯主义(Christofascism)是基督教和法西斯主义的有争议混成词。这个是一个由Dorothee Sölle在Beyond Mere Obedience: Reflections on a Christian Ethic for the F
  • 超氧化钾超氧化钾,分子式KO2,是一级氧化剂,与水剧烈反应。超氧化钾是由K+和O2−组成的碳化钙型粉末状晶体。有吸湿性、顺磁性。超氧化钾的制备是在不锈钢置换釜内,以金属钠置换氯化钾得
  • 先麦食品先麦食品股份有限公司(英语:Shan Mai Food CO., LTD.)创立于1967年,为台湾本土企业,曾是台中市大甲区知名的糕饼业者,同时也是芋头酥的创始店,其生产的芋头酥曾获选为“国宴点心”
  • 道次第道次第(藏语:.mw-parser-output .uchen{font-family:"Qomolangma-Dunhuang","Qomolangma-Uchen Sarchen","Qomolangma-Uchen Sarchung","Qomolangma-Uchen Suring","Qomolangm