马哈拉诺比斯距离

✍ dations ◷ 2025-11-27 00:30:48 #多变量统计

马哈拉诺比斯距离是由印度统计学家马哈拉诺比斯 (英语)提出的,表示数据的协方差距离。它是一种有效的计算两个未知样本集的相似度的方法。与欧氏距离不同的是它考虑到各种特性之间的联系(例如:一条关于身高的信息会带来一条关于体重的信息,因为两者是有关联的)并且是尺度无关的(scale-invariant),即独立于测量尺度。对于一个均值为 μ = ( μ 1 , μ 2 , μ 3 , , μ p ) T {\displaystyle \mu =(\mu _{1},\mu _{2},\mu _{3},\dots ,\mu _{p})^{T}}

其中 σ i {\displaystyle \sigma _{i}} x i {\displaystyle x_{i}} 的标准差。

马哈拉诺比斯距离是基于样本分布的一种距离。物理意义就是在规范化的主成分空间中的欧氏距离。所谓规范化的主成分空间就是利用主成分分析对一些数据进行主成分分解。再对所有主成分分解轴做归一化,形成新的坐标轴。由这些坐标轴张成的空间就是规范化的主成分空间。

换句话说,主成分分析就是把椭球分布的样本改变到另一个空间里,使其成为球状分布。而马哈拉诺比斯距离就是在样本呈球状分布的空间里面所求得的欧式距离。

当然,上面的解释只是对椭球分布而言,对一般分布,只能消除分布的二阶相关性,而不能消除高阶相关性。

相关

  • A01A·B·C·D·G·H·QI·J·L·M·N·P·R·S·VATC代码A01(口腔病药物)是解剖学治疗学及化学分类系统的一个药物分组,这是由世界卫生组织药物统计方法整合中心(The WHO Collabor
  • 图像图像是人对视觉感知的物质再现。图像可以由光学设备获取,如照相机、镜子、望远镜及显微镜等;也可以人为创作,如手工绘画。图像可以记录、保存在纸质介质、胶片等等对光信号敏感
  • 马蹄糕马蹄糕是以马蹄粉(即荸荠磨成的粉)制成的糕点。其他材料还包括马蹄粒、蔗糖、猪油和水分。马蹄糕一般都是晶莹剔透的金黄色糕块,夹杂着白色的马蹄粒。通常先将马蹄粉用水开匀,制
  • 法印战争英法北美战争(英语:French and Indian War),或加拿大所称的征服战争(英语:War of the Conquest),是1754年至1763年间大不列颠王国和法兰西王国在北美的一场战争。1756年,战争扩大至世
  • 玉蕊玉蕊(学名:Barringtonia racemosa),又名水茄冬,为玉蕊科玉蕊属的半红树植物。分布于亚洲、非洲、台湾、大洋洲以及中国大陆的广东和广西、海南岛等地。因耐风耐盐,常植于海滨地区,
  • 阿末安沙·阿兹曼阿末安沙·阿兹曼(马来语:Ahmad Amshay Azman,1992年8月28日-),马来西亚男子跳水运动员。他于2015年参加世界游泳锦标赛。一年后又参加了第31届夏季奥林匹克运动会。
  • 格奥尔基·瓦西利基格奥尔基·瓦西利基(罗马尼亚语:Gheorghe Vasilichi;1902年9月7日-1974年12月31日),罗马尼亚工人党中央政治执行委员会委员,罗马尼亚全国手工业合作社中央联合会主席。1902年,出生于
  • 斯盖拉·阿斯丁斯盖拉·阿斯丁·利普斯坦(Skylar Astin Lipstein,1987年9月23日-),美国男演员以及歌手。他知名的作品有曾获得托尼奖的舞台剧Spring Awakening当中饰演 Georg ;以及电影《续写哈
  • 马马利加Mămăligă(罗马尼亚语发音:.mw-parser-output .IPA{font-family:"Charis SIL","Doulos SIL","Linux Libertine","Segoe UI","Lucida Sans Unicode","Code2000","Gentium","G
  • 高汉筠高汉筠(873年-938年),字时英,唐朝末年齐州历山人,在五代十国时期先后效力后梁、晋国、后唐、后晋。曾祖高诣,曾任历山邑令,于是就地安家。高汉筠年轻时喜欢书传,曾去长白山讲学,正逢唐