马哈拉诺比斯距离

✍ dations ◷ 2025-11-30 08:19:09 #多变量统计

马哈拉诺比斯距离是由印度统计学家马哈拉诺比斯 (英语)提出的,表示数据的协方差距离。它是一种有效的计算两个未知样本集的相似度的方法。与欧氏距离不同的是它考虑到各种特性之间的联系(例如:一条关于身高的信息会带来一条关于体重的信息,因为两者是有关联的)并且是尺度无关的(scale-invariant),即独立于测量尺度。对于一个均值为 μ = ( μ 1 , μ 2 , μ 3 , , μ p ) T {\displaystyle \mu =(\mu _{1},\mu _{2},\mu _{3},\dots ,\mu _{p})^{T}}

其中 σ i {\displaystyle \sigma _{i}} x i {\displaystyle x_{i}} 的标准差。

马哈拉诺比斯距离是基于样本分布的一种距离。物理意义就是在规范化的主成分空间中的欧氏距离。所谓规范化的主成分空间就是利用主成分分析对一些数据进行主成分分解。再对所有主成分分解轴做归一化,形成新的坐标轴。由这些坐标轴张成的空间就是规范化的主成分空间。

换句话说,主成分分析就是把椭球分布的样本改变到另一个空间里,使其成为球状分布。而马哈拉诺比斯距离就是在样本呈球状分布的空间里面所求得的欧式距离。

当然,上面的解释只是对椭球分布而言,对一般分布,只能消除分布的二阶相关性,而不能消除高阶相关性。

相关

  • 罗格列酮罗格列酮(Rosiglitazone)是一种用于控制糖尿病的药物,商品名称有:安糖健、文迪雅、梵帝雅(Avandia)等。由葛兰素史克(GSK)开发制造。制剂为药片,每片含2mg、4mg或8mg马来酸罗格列酮(Ro
  • 风土地方性流行(Endemic)又称地方病或风土病,在流行病学中,指毋须从外界输入,便能在人口内持续出现的疾病,例如:在英国,水痘是地方性流行病,而疟疾并不是。虽然每年在英国都会出现数宗本
  • 陈晔光陈晔光(1964年8月-),江西乐安人,中国细胞生物学家,清华大学教授。2017年当选为中国科学院院士。1983年本科毕业于江西大学生物系,1986年获江西大学硕士学位。1990年获美国福坦莫大
  • 我是柏林人坐标:52°29′06″N 13°20′40″E / 52.484932°N 13.344395°E / 52.484932; 13.344395“我是柏林人”(德语:Ich bin ein Berliner)是1963年6月26日美国总统约翰·肯尼迪在西
  • 一级方程式一级方程式赛车(英语:Formula One,也叫Formula 1或者F1)是由国际汽车联盟举办的最高等级的赛车比赛。F1的正式名称为“国际汽车联合会世界一级方程式锦标赛”。名称中“方程式”
  • 六经辨证六经辨证,是中医辨证方法的一种,首创自张仲景《伤寒论》。由黄帝内经中所提到的六经,但内经之中无详细说明六经的病症发展。 由汉张仲景所整理六大病症与误治条文来解释六经的
  • 质量守恒定律质量守恒定律是自然界普遍存在的基本定律之一。此定律指出,对于任何物质和能量全部转移的系统来说,系统的质量必须随着时间的推移保持不变,因为系统质量不能改变,不能增加或消除
  • 沈彬 (明朝)沈彬(1411年-1469年),字原质,浙江湖州府武康县人,民籍。明朝政治人物。进士出身。浙江乡试第八名。正统七年(1442年),参加壬戌科会试,得贡士第三十四名。殿试登进士第二甲第二十三名。
  • 野中郁次郎野中郁次郎(のなか いくじろう,1935年5月10日-),日本经营策略学者,被誉为“知识创造理论之父”、“知识管理的拓荒者”。他和竹内弘高合著的《创新求胜-智价企业论》(The Knowledge
  • Aircrack-NGAircrack-ng是一个与802.11标准的无线网络分析有关的安全软件,主要功能有:网络侦测,数据包嗅探,WEP和WPA/WPA2-PSK破解。Aircrack-ng可以工作在任何支持监听模式的无线网卡上(设