信息瓶颈

✍ dations ◷ 2025-12-02 09:25:59 #聚类分析,多变量统计,信息论

信息瓶颈(英语:information bottleneck)是信息论中的一种方法,由纳夫塔利·泰斯比(英语:Naftali Tishby)、费尔南多·佩雷拉(Fernando C. Pereira)与威廉·比亚莱克(英语:William Bialek)于1999年提出。对于一随机变量 X {\displaystyle X} ,假设已知其与观察变量 Y {\displaystyle Y} 之间的联合概率分布 p ( X , Y ) {\displaystyle p(X,Y)} 。此时,当需要概括(聚类) X {\displaystyle X} 时,可以通过信息瓶颈方法来分析如何最优化地平衡准确度与复杂度(数据压缩)。该方法的应用还包括分布聚类(distributional clustering)与降维等。此外,信息瓶颈也被用于分析深度学习的过程。

信息瓶项方法中运用了互信息的概念。假设压缩后的随机变量为 T {\displaystyle T} ,我们试图用 T {\displaystyle T} 代替 X {\displaystyle X} 来预测 Y {\displaystyle Y} 。此时,可使用以下算法得到最优的 T {\displaystyle T}

其中 I ( X ; T ) {\displaystyle I(X;T)} I ( T ; Y ) {\displaystyle I(T;Y)} 分别为 X {\displaystyle X} T {\displaystyle T} 之间、以及 T {\displaystyle T} Y {\displaystyle Y} 之间的互信息,可由 p ( X , Y ) {\displaystyle p(X,Y)} 计算得到。 β {\displaystyle \beta } 则表示拉格朗日乘数。

相关

  • 快速增强在气象学上,快速增强(英语:Rapid intensification)是指某热带气旋在短时间内剧烈增强的现象。美国国家飓风中心将“快速增强”界定为热带气旋的最大持续风速在24小时内,增加最少3
  • Nature (组合)NATURE(朝鲜语:네이처)是韩国n.CH 娱乐公司推出的女子组合,由韩国籍成员Sohee、Saebom、Lu、Chaebin、Loha、Uchae、Sunshine,中国籍成员Aurora及日本籍成员Haru组成。组合于2018
  • 的里雅斯特的里雅斯特自由区(意大利语:Territorio libero di Trieste;斯洛文尼亚语:Svobodno tržaško ozemlje;克罗地亚语:Slobodni teritorij Trsta)是位于意大利北部和南斯拉夫之间的一个
  • 碲化铜碲化铜是一种无机化合物,化学式为CuTe。碲化铜在自然界中以Vulcanite矿(英语:Vulcanite)的形式存在。硫酸铜的热溶液和碲反应,或者硫酸铜溶液与碲化物(如Na2Te等)反应,都可以得到CuT
  • 三齿驼蝶螺三齿驼蝶螺(学名:),是有壳翼足目驼蝶螺科的一种。主要分布于韩国、中国大陆、台湾,常栖息在浅海沙底。三齿驼蝶螺的分布极为广泛,包括地中海、大西洋(亚速尔群岛、佛得角与缅因湾)、
  • 阿尔·奥弗顿阿尔·奥弗顿(英语:Al Overton,1912年5月20日-1985年8月1日),美国音频工程师。他曾因电影007之金刚钻提名奥斯卡最佳音响效果奖。自1954年至1975年间,他曾参与超过90部电影的制作。
  • 大卫·纽根特大卫·詹姆斯·纽根特(英语:David James Nugent,1985年5月2日-)是一名英格兰足球运动员,司职前锋,现时效力英冠俱乐部普雷斯顿。他此前曾分别为贝里、普雷斯顿和朴茨茅斯在英格兰足
  • 庙会 (日本)庙会是一种起源于宗教活动的风俗。日本在各种节日同中国一样也有庙会,但举办地点除了佛教寺院之外还有神道教的神社。不过随着明治维新五年后的1873年日本弃天保历改格里历,庆
  • 傅振商傅振商(1573年-1640年),字君雨,河南汝宁府汝阳县(在今河南省汝南县、平舆县)县城西七十里坟塘人。明朝政治人物。傅振商于万历三十五年(1607年)中丁未科进士,选为翰林院庶吉士,改巡察御
  • 袪魅祛魅(英语:Disenchantment)在社会科学中是指在现代社会消去神秘主义(魅惑力)的表面并把文化合理化,这个概念最初由马克斯·韦伯借用弗里德里希·席勒的理论来描述现代化、官僚化的