马哈拉诺比斯距离

✍ dations ◷ 2025-09-10 07:14:02 #多变量统计

马哈拉诺比斯距离是由印度统计学家马哈拉诺比斯 (英语)提出的,表示数据的协方差距离。它是一种有效的计算两个未知样本集的相似度的方法。与欧氏距离不同的是它考虑到各种特性之间的联系(例如:一条关于身高的信息会带来一条关于体重的信息,因为两者是有关联的)并且是尺度无关的(scale-invariant),即独立于测量尺度。对于一个均值为 μ = ( μ 1 , μ 2 , μ 3 , , μ p ) T {\displaystyle \mu =(\mu _{1},\mu _{2},\mu _{3},\dots ,\mu _{p})^{T}}

其中 σ i {\displaystyle \sigma _{i}} x i {\displaystyle x_{i}} 的标准差。

马哈拉诺比斯距离是基于样本分布的一种距离。物理意义就是在规范化的主成分空间中的欧氏距离。所谓规范化的主成分空间就是利用主成分分析对一些数据进行主成分分解。再对所有主成分分解轴做归一化,形成新的坐标轴。由这些坐标轴张成的空间就是规范化的主成分空间。

换句话说,主成分分析就是把椭球分布的样本改变到另一个空间里,使其成为球状分布。而马哈拉诺比斯距离就是在样本呈球状分布的空间里面所求得的欧式距离。

当然,上面的解释只是对椭球分布而言,对一般分布,只能消除分布的二阶相关性,而不能消除高阶相关性。

相关

  • 头孢克洛头孢克洛(英语:Cefaclor),商品名如希克劳,是第二代头孢类抗生素,用来治疗由细菌感染导致的症状如肺炎,化学名(6R,7R)-7--3-氯-8-氧代-5-硫杂-1-氮杂双环辛-2-烯-2-甲酸,化学式C15H14
  • 血氧计血氧饱和仪(英语:Pulse Oximeter,简称:血氧仪),是一种主要为测量病人的血液中的脉搏氧饱和度的仪器。最初的一台血氧饱和仪由G.A. Millikan于20世纪40年代研发成功。自1980年代,美
  • 马偕墓新北市私立淡江高级中学,位于新北市淡水区真理街26号,由台湾基督长老教会所属,创设于1914年,为北台湾最早的私立中学。1882年7月,加拿大长老会宣教士马偕在沪尾(今新北市淡水区)设
  • 自然-结构与分子生物学《自然-结构与分子生物学》(英文:Nature Structural & Molecular Biology)是《自然》杂志的结构生物学与分子生物学分册,也是该领域经由同行评审的权威科学期刊。该杂志由自然出
  • 氢正离子氢正离子(英语:hydron)在化学中常指为原子氢的阳离子形式。由于氢原子只有一个电子,因此氢正离子实际上就是氢原子核。同位素氢-1(H)的正离子实际上就是质子。在水溶液中,氢正离子
  • 神经精神病学评定表神经精神病学评定表(英语:Schedules for Clinical Assessment in Neuropsychiatry,缩写为SCAN)是为诊断和测量可能出现在成人身上的精神病症状而由世界卫生组织创建的。 该评定
  • 阿德南·伊卜尼·卡保·伊卜尼·加尼阿德南·伊卜尼·卡保·伊卜尼·加尼(印尼语:Adnan Kapau Gani;1905年9月16日-1968年12月23日),已故印度尼西亚(印尼)政治人物,穆斯林,曾出任印尼副总理、经济部长。他在现属西苏门答
  • 孙维城孙维城(1540年-1602年),字宗甫,号卫宇,山东承宣布政使司东昌府丘县(今河北省邱县邱城镇)人,明朝政治人物。隆庆四年(1570年),乡试中举。隆庆五年(1571年),联捷辛未科进士,相继担任河南濬县、
  • 深圳少年儿童图书馆深圳少年儿童图书馆,或称深圳少儿图书馆(Shenzhen Children's Library),是中国广东省深圳市的一座专门面向少年儿童读者和少年儿童教育工作者群体的大型公共图书馆,由深圳市人民
  • 灰头麦鸡灰头麦鸡(学名:)-为鸻科麦鸡属的鸟类。在中国大陆,分布于华北、华南等地。该物种的模式产地在印度。