马哈拉诺比斯距离

✍ dations ◷ 2025-12-08 01:17:07 #多变量统计

马哈拉诺比斯距离是由印度统计学家马哈拉诺比斯 (英语)提出的,表示数据的协方差距离。它是一种有效的计算两个未知样本集的相似度的方法。与欧氏距离不同的是它考虑到各种特性之间的联系(例如:一条关于身高的信息会带来一条关于体重的信息,因为两者是有关联的)并且是尺度无关的(scale-invariant),即独立于测量尺度。对于一个均值为 μ = ( μ 1 , μ 2 , μ 3 , , μ p ) T {\displaystyle \mu =(\mu _{1},\mu _{2},\mu _{3},\dots ,\mu _{p})^{T}}

其中 σ i {\displaystyle \sigma _{i}} x i {\displaystyle x_{i}} 的标准差。

马哈拉诺比斯距离是基于样本分布的一种距离。物理意义就是在规范化的主成分空间中的欧氏距离。所谓规范化的主成分空间就是利用主成分分析对一些数据进行主成分分解。再对所有主成分分解轴做归一化,形成新的坐标轴。由这些坐标轴张成的空间就是规范化的主成分空间。

换句话说,主成分分析就是把椭球分布的样本改变到另一个空间里,使其成为球状分布。而马哈拉诺比斯距离就是在样本呈球状分布的空间里面所求得的欧式距离。

当然,上面的解释只是对椭球分布而言,对一般分布,只能消除分布的二阶相关性,而不能消除高阶相关性。

相关

  • 前视人体解剖学方位是解剖学中用来描述人体器官的相对位置、以及运动方向的标准术语,以两手放在身体两侧且掌心面向前方的标准解剖姿势(英语:Standard anatomical position)为准。在
  • 日本医科大学日本医科大学(日语:日本医科大学/にほんいかだいがく Nihon ika daigaku */?)是位于东京都文京区的一所私立大学。
  • 软舌螺动物门软舌螺动物(学名:Hyolitha)是生活在古生代的一类神秘动物,具有小圆锥形的螺壳。这些物种目前都已全部灭绝;其化石一般只能保存锥壳、口盖和附肢三个部分,外壳为钙质成分,两侧对称。
  • 次方幂运算(英语:Exponentiation),又称指数运算,是数学运算,表达式为 b n {\displa
  • 塞拉皮斯塞拉比斯(拉丁语:Serapis、古希腊语:Σάραπις)或译塞拉皮斯(波西杰克森译塞瑞比斯)是希腊化时代的埃及神祇,是一个希腊-埃及复合神。公元前3世纪,托勒密王朝的法老托勒密一世
  • 三氯化硼三氯化硼(BCl3),是一种有强烈臭味的气体,用于制各种硼化合物,也用作有机合成催化剂、硅酸盐分解时的助溶剂以及对钢铁进行硼化等。硼和卤素反应产生硼的三卤化物。但在工业上,三氯
  • 卡西迪威廉·摩根·“比尔”·卡西迪(英语:William Morgan "Bill" Cassidy;1957年9月8日-),是一位美国共和党政治人物,2015年起担任路易斯安那州美国参议院议员,此前,他曾是美国众议院路易
  • 环烷酸环烷酸(CAS: 1338-24-5 )又称石油酸,是含环戊基和环己基羧酸的混合物,分子量自120至700。其主体部分是有9至20碳原子的羧酸。McKee等人认为环烷酸主要是含10至16个碳的含环脂
  • 网络媒体本条目介绍网络媒体的发展沿革与现况。→ CNN
  • 清州广播清州广播(英语:Cheongju Broadcasting,简称CJB)是韩国忠清北道清州市的一家地区性民间广播电视公司。在1997年2月27日成立,1997年10月17日开播电视频道。属SBS联播网成员。