马哈拉诺比斯距离

✍ dations ◷ 2025-11-25 11:56:05 #多变量统计

马哈拉诺比斯距离是由印度统计学家马哈拉诺比斯 (英语)提出的,表示数据的协方差距离。它是一种有效的计算两个未知样本集的相似度的方法。与欧氏距离不同的是它考虑到各种特性之间的联系(例如:一条关于身高的信息会带来一条关于体重的信息,因为两者是有关联的)并且是尺度无关的(scale-invariant),即独立于测量尺度。对于一个均值为 μ = ( μ 1 , μ 2 , μ 3 , , μ p ) T {\displaystyle \mu =(\mu _{1},\mu _{2},\mu _{3},\dots ,\mu _{p})^{T}}

其中 σ i {\displaystyle \sigma _{i}} x i {\displaystyle x_{i}} 的标准差。

马哈拉诺比斯距离是基于样本分布的一种距离。物理意义就是在规范化的主成分空间中的欧氏距离。所谓规范化的主成分空间就是利用主成分分析对一些数据进行主成分分解。再对所有主成分分解轴做归一化,形成新的坐标轴。由这些坐标轴张成的空间就是规范化的主成分空间。

换句话说,主成分分析就是把椭球分布的样本改变到另一个空间里,使其成为球状分布。而马哈拉诺比斯距离就是在样本呈球状分布的空间里面所求得的欧式距离。

当然,上面的解释只是对椭球分布而言,对一般分布,只能消除分布的二阶相关性,而不能消除高阶相关性。

相关

  • 荣军院荣军院(法语:L'hôtel des Invalides)。位于法国巴黎第七区,是巴黎一座重要的古迹。荣军院始建于1670年,由当时法王路易十四下令建造,是一家用来接待及治疗退伍军人及抗战后残疾军
  • 西印度毁灭述略《西印度毁灭述略》(西班牙语:Brevísima relación de la destrucción de las Indias,另有中文译名《西印度灭亡简史》),由16世纪西班牙多明我会教士巴托洛梅·德拉斯·卡萨斯(B
  • 恒星光谱在天文学,恒星分类是将恒星依照光球的温度分门别类,伴随着的是光谱特性、以及随后衍生的各种性质。根据维恩定律可以用波长来测量物体表面的温度,但对距离遥远的恒星是非常困难
  • 938年重要事件及趋势重要人物
  • 油桐 Hemsl.油桐(学名:)是大戟科中的一种落叶树(英语:deciduous tree),原产地为中国大陆南方、缅甸、越南北部。亦有很多俗名,如“油桐树”、“桐油树”、“桐子树”、“光桐”、“三年
  • 2012年夏季奥林匹克运动会开幕式入场旗手以下为2012年夏季奥林匹克运动会开幕典礼各代表团入场时的旗手列表。本届奥运会共有205个代表团参加,根据国际奥委会规则,开幕式入场次序除希腊代表团以奥林匹克发源地首先入
  • 任素汐任素汐(1988年6月1日-),山东莱州人,中国大陆女演员,毕业于中央戏剧学院2005级导表班。
  • 国营宫廷啤酒厂慕尼黑国有皇家宫廷酿酒厂(德语:Staatliches Hofbräuhaus in München,又名Hofbräu München)是位于德国慕尼黑的一个酿酒厂,归巴伐利亚州政府所有。历史上它曾是巴伐利亚王国
  • 魏今非魏今非(1903年-1983年10月17日),男,江苏句容人,中华人民共和国政治人物,曾任广东省人民委员会副省长,国家工商行政管理总局党组书记、局长,第五届全国政协委员。
  • 三谷大学三谷大学(英语:Tri-Valley University,TVU)位于美国加利福尼亚州普莱森顿,是一所未经认可的私立大学。 其学校主页介绍称,三谷大学是一所具有基督教环境的高等教育机构,设有工程学