马哈拉诺比斯距离

✍ dations ◷ 2025-11-30 22:01:05 #多变量统计

马哈拉诺比斯距离是由印度统计学家马哈拉诺比斯 (英语)提出的,表示数据的协方差距离。它是一种有效的计算两个未知样本集的相似度的方法。与欧氏距离不同的是它考虑到各种特性之间的联系(例如:一条关于身高的信息会带来一条关于体重的信息,因为两者是有关联的)并且是尺度无关的(scale-invariant),即独立于测量尺度。对于一个均值为 μ = ( μ 1 , μ 2 , μ 3 , , μ p ) T {\displaystyle \mu =(\mu _{1},\mu _{2},\mu _{3},\dots ,\mu _{p})^{T}}

其中 σ i {\displaystyle \sigma _{i}} x i {\displaystyle x_{i}} 的标准差。

马哈拉诺比斯距离是基于样本分布的一种距离。物理意义就是在规范化的主成分空间中的欧氏距离。所谓规范化的主成分空间就是利用主成分分析对一些数据进行主成分分解。再对所有主成分分解轴做归一化,形成新的坐标轴。由这些坐标轴张成的空间就是规范化的主成分空间。

换句话说,主成分分析就是把椭球分布的样本改变到另一个空间里,使其成为球状分布。而马哈拉诺比斯距离就是在样本呈球状分布的空间里面所求得的欧式距离。

当然,上面的解释只是对椭球分布而言,对一般分布,只能消除分布的二阶相关性,而不能消除高阶相关性。

相关

  • 广泛性焦虑症广泛性焦虑障碍(英语:Generalized Anxiety Disorder),是经常为小事而感到持续焦虑的状态,这种焦虑与周围任何特定的情景都没有关系,而一般是由过度的担忧引起。大部分人有时会感到
  • 中国数学史中国数学史是指中国的数学发展史。中国传统数学称为算学,起源于仰韶文化,距今有五千余年历史,在周公时代,数乃是六艺之一。在春秋时代十进位制的筹算已经普及。著名日本数学史家
  • 双层脂膜磷脂双分子层(英语:lipid bilayer 或phospholipid bilayer)是由两层磷脂分子组成的薄膜。 几乎所有细胞生物的细胞膜和许多病毒的包膜都主要由磷脂双分子层构成,此外,核被膜和
  • 提后提摩太后书(希腊语:ΠΡΟΣ ΤΙΜΟΘΕΟΝ Β΄)是新约圣经中的一卷,通常列于第16卷。由于提摩太前书、提摩太后书和提多书这三卷圣经的对象是教会牧者,因此亦称为教牧书信(Pa
  • 薛耿求薛耿求(韩语:설경구,1967年5月14日-),韩国男演员,名字常音译为薛景求。1996年,薛耿求与舞台剧前辈安内相的妹妹结婚,分居4年后于2006年离婚,育有1女。2009年5月28日,与曾合作过电影《光
  • M10坦克歼击车M10坦克歼击车(M10 tank destroyer)是美军在第二次世界大战期间所使用的一款坦克歼击车。当时的美军部队一般都称它作“TDs”(美军当时以TDs一词来称呼所有坦克歼击车),而其官方
  • Thomas Sowell托马斯·索维尔(英语:Thomas Sowell,1930年6月30日-),美国著名经济学家,芝加哥经济学派的代表人物之一。托马斯·索维尔1930年6月30日出生于美国北卡罗来纳州的加斯托尼亚。获得哈
  • 小野玄妙小野玄妙(1883年-1939年)日本佛教美术学者、藏经学者。神奈川县人,号二楞学人。属净土宗学僧。俗名金次郎。十四岁时,入净土宗镰仓光明寺为僧,改名玄妙,其后入宗教大学(现大正大学)。
  • 李治 (消歧义)李治可以是下列人物:
  • 道下大树道下大树(1975年12月24日-),是一位日本的政治人物,所属政党为立宪民主党,2017年10月起就任众议院议员。