统计距离

✍ dations ◷ 2025-02-24 02:27:25 #度量几何,统计分析

在统计学、概率论和信息论中,统计距离量化了两个统计对象之间的距离。统计对象可以是两个随机变量,两个概率分布或样本,或者一个独立样本点和一个点群之间的距离,或者更加广泛的样本点。

统计距离很多情况下不是由度量诱导的,它们不一定是对称的。一些统计距离也被称为统计区别度(statistical divergence)。

各种统计距离常常有许多名称。有时名称的相似性容易引起误解,有时不同作者或不同时期一些术语的意义也不尽相同。常见的有统计偏差(deviation),区分度(discriminant),区别度(divergence),对比函数(contrast function),度量等。信息论中也称为交叉熵(cross entropy),相对熵(relative entropy),discrimination information, information gain等。

给定一个集合 ,,其上的度量距离是一个非负实值函数 : × → R对任意的 中的 , , ,这个函数满足如下条件:

许多统计距离不满足度量距离的要求。不满足正定性的常常被称为伪度量,不满足对称性的通常被称为准度量,不满足三角不等式被称为半度量。只满足上述(1)和(2)条件的统计距离被称为区别度(divergence)。

f-区别度:KL区别度(相对熵), Hellinger区别度,全变差距离;

仁义熵;

延森-香浓区别度。

相关

  • 萨尔布吕肯萨尔布吕肯(德语:Saarbrücken)是德国萨尔州的首府,人口约为17万9千人。萨尔布吕肯曾经是一个巨大煤层的工业和运输中心。这里的工厂生产铁和钢、糖、啤酒、陶器、光学仪器、机
  • 流通市场起源于古时人类对于固定时段或地点进行交易的场所的称呼,而此交易场所是那些需要经常进行物品交换的人,为了减少搜寻成本所自发形成的。词中的“市”指的并非“城市”,而是
  • 衢江区衢江区是中国浙江省衢州市下辖的一个区。东汉初平三年(192年)开始设县,时名为新安,西晋改为信安、唐改为西安县,民国元年(1912年)始称衢县,至今已有1800多年。2001年设立衢江区。下
  • 泊 (单位)泊(poise,按法语发音为.mw-parser-output .IPA{font-family:"Charis SIL","Doulos SIL","Linux Libertine","Segoe UI","Lucida Sans Unicode","Code2000","Gentium","Gentium
  • 拉丁美洲文学爆炸拉丁美洲文学爆炸(西班牙语:Boom Latinoamericano)是一场发生在1960年代至1970年代之间的文学运动,在那期间一大批相关拉丁美洲作家的作品流行于欧洲并最终流行于全世界。说起这
  • 2014年国际足联世界杯预选赛 – 中北美洲及加勒比海区第二轮本面页提供2014年世界杯预选赛中北美洲及加勒比海区第二轮的赛事总结。第二轮赛事由本区排名第7-25位的球队联同第一轮的5支优胜球队参赛。球队被编为6组,每组4队,于2011年7月
  • 伊丽莎白·巴雷特·勃朗宁伊丽莎白·巴雷特·勃朗宁(英语:Elizabeth Barrett Browning,1806年3月6日-1861年6月29日)是英国维多利亚时代最受人尊敬的诗人之一。伊丽莎白·勃朗宁在英格兰的赫普恩德(Hope En
  • 约翰内斯·凯宾约翰内斯·凯宾(爱沙尼亚语:Johannes Käbin;俄语:Ива́н (Йоха́ннес) Гу́ставович Кэ́бин;1905年9月24日-1999年10月26日),苏联党和国家领导人、苏
  • 阿尔伯托·康塔多Stage racesSingle-day races and Classics 阿尔伯托·康塔多(Alberto Contador,1982年12月6日-),生于西班牙首都马德里,是一名西班牙职业公路自行车运动员,2007年、2009年环法自
  • 黄福黄福(1362年-1440年),字如锡,号后乐,谥忠宣,中书省益都路潍州昌邑县(今山东省昌邑县)人,明朝政治人物。黄福为工部尚书。安南属明时期,任首位交趾承宣布政使司布政使兼提刑按察使司按察