马哈拉诺比斯距离

✍ dations ◷ 2025-11-26 01:53:01 #多变量统计

马哈拉诺比斯距离是由印度统计学家马哈拉诺比斯 (英语)提出的,表示数据的协方差距离。它是一种有效的计算两个未知样本集的相似度的方法。与欧氏距离不同的是它考虑到各种特性之间的联系(例如:一条关于身高的信息会带来一条关于体重的信息,因为两者是有关联的)并且是尺度无关的(scale-invariant),即独立于测量尺度。对于一个均值为 μ = ( μ 1 , μ 2 , μ 3 , , μ p ) T {\displaystyle \mu =(\mu _{1},\mu _{2},\mu _{3},\dots ,\mu _{p})^{T}}

其中 σ i {\displaystyle \sigma _{i}} x i {\displaystyle x_{i}} 的标准差。

马哈拉诺比斯距离是基于样本分布的一种距离。物理意义就是在规范化的主成分空间中的欧氏距离。所谓规范化的主成分空间就是利用主成分分析对一些数据进行主成分分解。再对所有主成分分解轴做归一化,形成新的坐标轴。由这些坐标轴张成的空间就是规范化的主成分空间。

换句话说,主成分分析就是把椭球分布的样本改变到另一个空间里,使其成为球状分布。而马哈拉诺比斯距离就是在样本呈球状分布的空间里面所求得的欧式距离。

当然,上面的解释只是对椭球分布而言,对一般分布,只能消除分布的二阶相关性,而不能消除高阶相关性。

相关

  • 药物的副作用在医学中,副作用(英语:side effect)是指药品往往有多种作用,作用于不同身体部位受体,治疗时利用其一种或一部分受体作用,其他作用或是受体产生作用即变成为副作用。虽然副作用一词
  • 肠道菌群肠道菌群(Gut flora、Gut microbiota或gastrointestinal microbiota)指在人类及人类以外动物(包括昆虫)的消化道内生存的微生物复杂群落。肠道宏基因组(metagenome)是肠道微生物群
  • 治疗 (消歧义)治疗可以是指:
  • 安洁莉娜·裘莉安吉丽娜·朱莉(又译作安杰利娜·朱莉)(英语:Angelina Jolie,1975年6月4日-),本名安吉丽娜·朱莉·沃特(Angelina Jolie Voight),美国影坛超级巨星、著名女演员、慈善家、社会活动家,美
  • 高丽若光高丽若光(生卒年不详),原名玄武若光,来自高句丽。是日本奈良时代豪族、在厅官人。高丽王氏, 武藏国高丽郡大领,官位从五位下。《日本书纪》作玄武若光,《续日本纪》作高丽若光。他
  • 陈海茵陈海茵(1976年8月6日-),台湾新闻主播,毕业于世新大学新闻学系。前任中天新闻台主播、东森新闻台《东森晚间新闻》主播。
  • 1UP.com1UP.com是一电子游戏网站,于2003年创立,是1UP Network的其中一部分,当时由Ziff Davis Media所拥有。2009年1月9日,赫斯特国际集团的UGO Entertainment宣布收购Ziff Davis Media
  • 尼古拉·瓦西里耶维奇·奥加尔科夫尼古拉·瓦西里耶维奇·奥加尔科夫(俄语:Николай Васильевич Огарков,1917年10月30日-1994年1月23日),苏联军事领导人,1977年晋升苏联元帅。曾任苏军总参
  • 权威书籍权威书籍是对一些经常被作为重要之使用(例如:教学、参考),因而具有经典性、权威性、代表性的书籍的称呼,意思是像圣哲经书那样可靠、正确。
  • 爱德华·瓦扬爱德华·瓦扬(法语:Édouard Vaillant 1840年1月26日-1915年12月18日)法国政治家,生于维耶尔宗律师家庭,1862年毕业于法国中央工艺美术学校,并在索邦大学攻读法律。 在巴黎,他认识