信息瓶颈

✍ dations ◷ 2025-12-01 08:31:32 #聚类分析,多变量统计,信息论

信息瓶颈(英语:information bottleneck)是信息论中的一种方法,由纳夫塔利·泰斯比(英语:Naftali Tishby)、费尔南多·佩雷拉(Fernando C. Pereira)与威廉·比亚莱克(英语:William Bialek)于1999年提出。对于一随机变量 X {\displaystyle X} ,假设已知其与观察变量 Y {\displaystyle Y} 之间的联合概率分布 p ( X , Y ) {\displaystyle p(X,Y)} 。此时,当需要概括(聚类) X {\displaystyle X} 时,可以通过信息瓶颈方法来分析如何最优化地平衡准确度与复杂度(数据压缩)。该方法的应用还包括分布聚类(distributional clustering)与降维等。此外,信息瓶颈也被用于分析深度学习的过程。

信息瓶项方法中运用了互信息的概念。假设压缩后的随机变量为 T {\displaystyle T} ,我们试图用 T {\displaystyle T} 代替 X {\displaystyle X} 来预测 Y {\displaystyle Y} 。此时,可使用以下算法得到最优的 T {\displaystyle T}

其中 I ( X ; T ) {\displaystyle I(X;T)} I ( T ; Y ) {\displaystyle I(T;Y)} 分别为 X {\displaystyle X} T {\displaystyle T} 之间、以及 T {\displaystyle T} Y {\displaystyle Y} 之间的互信息,可由 p ( X , Y ) {\displaystyle p(X,Y)} 计算得到。 β {\displaystyle \beta } 则表示拉格朗日乘数。

相关

  • 保罗·格莱斯保罗·格莱斯(Herbert Paul Grice,1913年3月13日-1988年8月28日)著名英国哲学家,属于分析哲学学派,著作以语言哲学为主。
  • 一次性密码本一次性密码本(one-time pad,缩写为OTP)是古典密码学中的一种加密算法。是以随机的密钥(key)组成明文,且只使用一次。在理论上,此种密码具有完善保密性,是牢不可破的。它的安全性已由
  • 浦那बाप तहसील घंटियाली Tier 1 city浦那(印地语:पुणे,原为Poona)也译作浦那,是印度第九大城、马哈拉施特拉邦的文化首都与第二大城、西高止山脉上的第一大城。
  • 厚生大臣厚生省(日文:こうせいしょう,英文:Ministry of Welfare)是已经废止的日本中央省厅,后来演变为厚生劳动省。“厚生”出自中国古代《尚书》“正德利用厚生惟和”。厚生大臣(日文:こう
  • 社旗山陕会馆社旗山陕会馆又名“山陕同乡会馆”,位于河南省南阳市社旗县,始建于清朝乾隆21年(1756年),由山西、陕西在赊旗店的商人集资兴建,做为他们同乡集会的场所,故名山陕同乡会馆。
  • 科学记数法科学记数法(英语:Scientific notation,英国则称为 Standard form),又称为科学记数法或科学记法,是一种数字的表示法。科学记数法最早由阿基米德提出。在科学记数法中,一个数被写成
  • 兰托斯人权奖兰托斯人权奖(英语:Lantos Human Rights Prize)由总部设在美国新罕普什尔州的兰托斯人权与正义基金会(The Lantos Foundation for Human Rights and Justice)颁发。兰托斯基金会
  • 西斯托·杜兰-巴连·科多韦斯Eduardo Peña (1995年-1996年)西斯托·阿方索·杜兰-巴连·科多韦斯(Sixto Durán Ballén Cordovez,1921年7月14日-2016年11月15日)是厄瓜多尔总统。杜兰-巴连美国哥伦比亚大
  • 察罕殿齐·森丕勒尼玛察罕殿齐·森丕勒尼玛(?-1942年)蒙古族,达尔罕旗九家子村人,第六世察罕殿齐活佛。第六世察罕殿齐活佛耶希达日扎被贬为俗人之后,1933年,达尔罕旗当年的落名灵童森丕勒尼玛被迎请至瑞
  • 帕乌利努斯培拉的帕乌利努斯(Paulinus of Pella)约活动于公元5世纪前后。他是古罗马著名诗人奥索尼乌斯之孙。他在46岁时皈依基督教,著有诗歌《感恩》,描述了西罗马帝国及其统治阶层的衰落