马哈拉诺比斯距离

✍ dations ◷ 2025-12-02 11:59:46 #多变量统计

马哈拉诺比斯距离是由印度统计学家马哈拉诺比斯 (英语)提出的,表示数据的协方差距离。它是一种有效的计算两个未知样本集的相似度的方法。与欧氏距离不同的是它考虑到各种特性之间的联系(例如:一条关于身高的信息会带来一条关于体重的信息,因为两者是有关联的)并且是尺度无关的(scale-invariant),即独立于测量尺度。对于一个均值为 μ = ( μ 1 , μ 2 , μ 3 , , μ p ) T {\displaystyle \mu =(\mu _{1},\mu _{2},\mu _{3},\dots ,\mu _{p})^{T}}

其中 σ i {\displaystyle \sigma _{i}} x i {\displaystyle x_{i}} 的标准差。

马哈拉诺比斯距离是基于样本分布的一种距离。物理意义就是在规范化的主成分空间中的欧氏距离。所谓规范化的主成分空间就是利用主成分分析对一些数据进行主成分分解。再对所有主成分分解轴做归一化,形成新的坐标轴。由这些坐标轴张成的空间就是规范化的主成分空间。

换句话说,主成分分析就是把椭球分布的样本改变到另一个空间里,使其成为球状分布。而马哈拉诺比斯距离就是在样本呈球状分布的空间里面所求得的欧式距离。

当然,上面的解释只是对椭球分布而言,对一般分布,只能消除分布的二阶相关性,而不能消除高阶相关性。

相关

  • 不等鞭毛门不等鞭毛总门(学名:Heterokonta)旧为不等鞭毛门,是真核生物的主要演化支之一,已知的下辖物种超过10万个物种,当中大多数属于藻类,从多细胞的大型藻类海带,到单细胞的各种浮游硅藻,这
  • TCR结构 / ECODT细胞受体(T cell receptor, TCR)是T细胞表面的特异性受体,负责识别由主要组织相容性复合体(MHC)所呈递的抗原,它与B细胞受体(英语:B-cell receptor)不同,并不能识别游离的
  • 褐变褐变或Food browning是指因食物所含有的物质进行化学反应而令食物转变为黄褐色的过程。 褐变可指:
  • 七党联盟七党联盟是尼泊尔的一个已不存在的政党联盟。该联盟牵头发起了2006年尼泊尔民主运动,迫使时任尼泊尔国王贾南德拉交出了最高权力。该联盟的成员有:
  • 普拉蒂巴·帕蒂尔普拉蒂巴·帕蒂尔(马拉地语:प्रतिभा पाटिल,印地语:प्रतिभा पाटील,1934年12月19日-),印度律师、政治家,印度国大党成员,曾任拉贾斯坦邦邦长,前任印度总统。普拉
  • 乔尼·弗林乔尼·威廉·弗林(英语:Jonny William Flynn,1989年2月6日-),美国NBA联盟职业篮球运动员。他在2009年的NBA选秀中第1轮第6顺位被明尼苏达森林狼选中。
  • 王调鼎王调鼎(?-1644年),字伯和,号我劬,莱州府潍县人,明朝、南明政治人物。王调鼎是万历四十三年(1615年)的举人,到崇祯四年(1631年)中进士,获授献县知县,擒拿大盗刘大力,并重修城池,建设石塘,得当地
  • 科林·戴维斯科林·雷克斯·戴维斯爵士,CH,CBE(英语:Sir Colin Rex Davis,1927年9月25日-2013年4月14日)是一位英国指挥家。刚开始的时候他在伦敦学习单簧管。1983年到1992年他指挥巴伐利亚广播
  • 赫尔穆特·本特奥斯赫尔穆特·本特奥斯(德语:Helmut Benthaus,1935年6月5日-)是一名德国前足球运动员及教练。
  • 木防己木防己(学名:)为防己科木防己属下的一个种。