马哈拉诺比斯距离

✍ dations ◷ 2025-12-06 02:39:22 #多变量统计

马哈拉诺比斯距离是由印度统计学家马哈拉诺比斯 (英语)提出的,表示数据的协方差距离。它是一种有效的计算两个未知样本集的相似度的方法。与欧氏距离不同的是它考虑到各种特性之间的联系(例如:一条关于身高的信息会带来一条关于体重的信息,因为两者是有关联的)并且是尺度无关的(scale-invariant),即独立于测量尺度。对于一个均值为 μ = ( μ 1 , μ 2 , μ 3 , , μ p ) T {\displaystyle \mu =(\mu _{1},\mu _{2},\mu _{3},\dots ,\mu _{p})^{T}}

其中 σ i {\displaystyle \sigma _{i}} x i {\displaystyle x_{i}} 的标准差。

马哈拉诺比斯距离是基于样本分布的一种距离。物理意义就是在规范化的主成分空间中的欧氏距离。所谓规范化的主成分空间就是利用主成分分析对一些数据进行主成分分解。再对所有主成分分解轴做归一化,形成新的坐标轴。由这些坐标轴张成的空间就是规范化的主成分空间。

换句话说,主成分分析就是把椭球分布的样本改变到另一个空间里,使其成为球状分布。而马哈拉诺比斯距离就是在样本呈球状分布的空间里面所求得的欧式距离。

当然,上面的解释只是对椭球分布而言,对一般分布,只能消除分布的二阶相关性,而不能消除高阶相关性。

相关

  • 希腊喜剧古希腊喜剧古希腊喜剧起源于祭祀酒神的狂欢歌舞和民间滑稽戏。喜剧(komoidia)的原意是“狂欢队伍之歌”,它同悲剧一样也是起源于酒神祭祀。古希腊喜剧也和悲剧一样保留着对白和
  • 高果糖浆高果糖浆(英语:High-fructose corn syrup、简称HFCS)亦称果葡糖浆、高果糖玉米糖浆或葡萄糖异构糖浆,是以酶法糖化淀粉所得到的糖化液经葡萄糖异构酶的异构作用,将一部分葡萄糖异
  • 佛祖佛祖可以指:
  • 海牛目 Sirenia small/small海牛目(学名:Sirenia)在海洋哺乳动物中是相当特殊的一群,所属物种均为植食性,以海草与其他水生植物为食。现存共有四种海牛目动物,分为两个科:海牛科(Trichechidae)及儒艮科(Dugongida
  • 王昌高丽昌王(朝鲜语:고려 창왕/高麗 昌王 Goryeo Chang'wang;1381年-1389年),讳王昌(朝鲜语:왕창/王昌 Wang Chang),高丽王朝第33位国王(1388年—1389在位),前任国王王禑之子。明太祖洪武二
  • 亚历山大·汉米尔顿·莱斯亚历山大·汉米尔顿·莱斯(Alexander H. Rice Jr.;1875年8月2日-1956年7月21日)是美国医生,地理学家,地质学家和探险家,以亚马逊河盆地探险闻名。从1929年到1952年,他是哈佛大学地理
  • 正宗白鸟正宗白鸟(1879年3月3日-1962年10月28日)本名正宗忠夫。生于日本冈山县和气郡,是一位小说家、剧作家、文学评论家。江户时代正宗家的后代,1896年就读东京专门学校(早稻田大学的前身
  • 阿纳瓦克阿纳瓦克(Anahuac)是位于美国得克萨斯州的一个城市。据2010年人口普查,阿纳瓦克有人口2,243人。阿纳瓦克在行政区划上属于钱伯斯县,并且是钱伯斯县的县治所在地。
  • 家弓家正家弓家正(1933年10月31日-2014年9月30日)是日本演员、声优及解说。2014年10月8日,家弓家正的所属声优事务所81 Produce发表同年9月30日他离世的消息,享年81岁。(粗体表示者为作品
  • 加利福尼亚岛加利福尼亚岛指的是欧洲人从16世纪开始的很长时间内持有的一个错误概念:加利福尼亚(实指现在的下加利福尼亚半岛)不是北美洲本土的一部分,而是一个与大陆分离的并由一个现在被认