信息瓶颈

✍ dations ◷ 2025-10-20 16:05:53 #聚类分析,多变量统计,信息论

信息瓶颈(英语:information bottleneck)是信息论中的一种方法,由纳夫塔利·泰斯比(英语:Naftali Tishby)、费尔南多·佩雷拉(Fernando C. Pereira)与威廉·比亚莱克(英语:William Bialek)于1999年提出。对于一随机变量 X {\displaystyle X} ,假设已知其与观察变量 Y {\displaystyle Y} 之间的联合概率分布 p ( X , Y ) {\displaystyle p(X,Y)} 。此时,当需要概括(聚类) X {\displaystyle X} 时,可以通过信息瓶颈方法来分析如何最优化地平衡准确度与复杂度(数据压缩)。该方法的应用还包括分布聚类(distributional clustering)与降维等。此外,信息瓶颈也被用于分析深度学习的过程。

信息瓶项方法中运用了互信息的概念。假设压缩后的随机变量为 T {\displaystyle T} ,我们试图用 T {\displaystyle T} 代替 X {\displaystyle X} 来预测 Y {\displaystyle Y} 。此时,可使用以下算法得到最优的 T {\displaystyle T}

其中 I ( X ; T ) {\displaystyle I(X;T)} I ( T ; Y ) {\displaystyle I(T;Y)} 分别为 X {\displaystyle X} T {\displaystyle T} 之间、以及 T {\displaystyle T} Y {\displaystyle Y} 之间的互信息,可由 p ( X , Y ) {\displaystyle p(X,Y)} 计算得到。 β {\displaystyle \beta } 则表示拉格朗日乘数。

相关

  • 形而上对宗教的批评 · 自由思想反教权主义 · 反宗教虚构宗教形而上自然主义,哲学学派之一,认为除了被自然科学研究的与我们所理解的物质世界相关的物、力、因以外凡是理论上不可
  • 脊椎驼背后凸症脊椎驼背后凸症(英语:Scheuermann's Disease) 亦称舒尔曼病、舒曼氏症(英语:Sherman's Disease),或绍尔曼病,是一种骨骼性疾病,造成脊椎曲线后凸,发生在胸部脊椎多于腰部脊椎。发生原
  • 乙酰氨基葡萄糖N-乙酰葡糖胺(GlcNAc;NAG)是葡糖胺的N-乙酰衍生物,分子式C8H15NO6。NAG与NAM为组成细菌细胞壁的单体,与葡糖醛酸为透明质酸的单体。NAG也是甲壳素的聚合单体。细菌疾病 · 科莱
  • 排错排错,或称除错,在系统管理、电子工程和软件工程等领域有广泛应用。排错过程一般要求参与者熟悉系统的正常运作状态及近期的变更历史,并通过系统排除的方法将问题一步步简化。
  • 奥托·威胥特利奥托·威胥特利1913年10月27日出生在奥匈帝国的普罗斯捷约夫,殁于1998年8月18日,捷克化学家,最著名的发明是现代软式隐形眼镜。其父为农具机生产工厂和汽车修护厂的股东之一,但
  • 快乐大本营快乐家族:《快乐大本营》是由中国大陆湖南卫视推出的一档综艺节目,于1997年7月11日首播,是中国大陆颇具影响力的综艺节目之一。节目开播初期以明星及普通观众参与的互动游戏环
  • 爱德华·伯恩施坦爱德华·伯恩施坦(德语:Eduard Bernstein,1850年1月6日-1932年12月18日)是一位德国社会民主主义理论家及政治家。1872年加入德国社会民主党,后来在外流亡数年,任几份社会主义杂志的
  • 交换码交换码是指用于交换文件所使用的编码。对于计算机而言,不同的系统有可能使用不同的内码。但如果不同系统间要交换文件,则会发生乱码现象。解决方法则为,在交换文件前,文件提供者
  • 噜摩噜摩(梵语:रुमा,IAST:Rumā)是印度史诗《罗摩衍那》中的角色,为猴王须羯哩婆妻子。在书中第四卷《猴国篇》中,噜摩与须羯哩婆相爱并准备结婚,但是噜摩的父亲不同意两人的婚事。
  • 夏尔·德尔波特夏尔·德尔波特(法语:Charles Delporte,1893年3月11日-1960年),比利时男子击剑运动员。他曾获得1924年夏季奥运会击剑比赛男子重剑个人金牌和男子重剑团体银牌。他也参加了1920年