信息瓶颈

✍ dations ◷ 2025-11-24 00:35:14 #聚类分析,多变量统计,信息论

信息瓶颈(英语:information bottleneck)是信息论中的一种方法,由纳夫塔利·泰斯比(英语:Naftali Tishby)、费尔南多·佩雷拉(Fernando C. Pereira)与威廉·比亚莱克(英语:William Bialek)于1999年提出。对于一随机变量 X {\displaystyle X} ,假设已知其与观察变量 Y {\displaystyle Y} 之间的联合概率分布 p ( X , Y ) {\displaystyle p(X,Y)} 。此时,当需要概括(聚类) X {\displaystyle X} 时,可以通过信息瓶颈方法来分析如何最优化地平衡准确度与复杂度(数据压缩)。该方法的应用还包括分布聚类(distributional clustering)与降维等。此外,信息瓶颈也被用于分析深度学习的过程。

信息瓶项方法中运用了互信息的概念。假设压缩后的随机变量为 T {\displaystyle T} ,我们试图用 T {\displaystyle T} 代替 X {\displaystyle X} 来预测 Y {\displaystyle Y} 。此时,可使用以下算法得到最优的 T {\displaystyle T}

其中 I ( X ; T ) {\displaystyle I(X;T)} I ( T ; Y ) {\displaystyle I(T;Y)} 分别为 X {\displaystyle X} T {\displaystyle T} 之间、以及 T {\displaystyle T} Y {\displaystyle Y} 之间的互信息,可由 p ( X , Y ) {\displaystyle p(X,Y)} 计算得到。 β {\displaystyle \beta } 则表示拉格朗日乘数。

相关

  • 利萨如轨道在航天动力学中,利萨如轨道(Lissajous orbit)是一种类周期性振动轨道,限制性三体系统中有5个平衡点(拉格朗日点),利萨如轨道是围绕与两个主体在同一直线上的L1和L2点运行的轨道。李
  • 最伟大的荷兰人《最伟大的荷兰人》(荷兰语:De Grootste Nederlander),是2004年由荷兰公共广播电视KRO在征集广大观众投票后评选的节目,和最伟大的100名英国人节目异曲同工。2004年11月15日公布
  • 何时加入奥运会奥林匹克运动会(希腊语:Ολυμπιακοί Αγώνες、法语:Jeux olympiques、英语:Olympic Games),简称奥运会、奥运,是国际目前最高等级的综合型体育赛事,由国际奥林匹克委
  • 缅甸对罗兴亚人的迫害2016年罗兴亚人危机,又称2016年缅甸政府对罗兴亚人袭警的反击行动,指的是缅甸对该国西部若开邦罗兴亚人恐怖分子的反击行动。这次行动是针对罗兴亚人恐怖分子袭击边境警察营地
  • 爱潮《爱潮》(英语:Storm in a Teacup)是一部由维克托·萨维尔和伊安·达林坡执导的1937年英国浪漫喜剧电影,由费雯·丽、雷克斯·哈里逊(首次主演)、塞西尔·帕克和萨拉·奥尔古德主
  • 鬼夜猴鬼夜猴(学名:Aotus lemurinus)是一种属于灵长目青猴科夜猴属的新世界猴。鬼夜猴的头型圆小,并拥有两颗又大又黑的双瞳,是夜行性的灵长目动物。和猫头鹰不同的是,它的双眼会发出由
  • 模拟电视模拟电视,也称类比电视(英语:Analog television),是指从电视图像信号的产生、传输、处理到接收机的复原,整个过程几乎都是在模拟体制下完成的电视系统或电视设备。它泛指电视的影
  • 西尔维斯特·史泰龙最差男主角 1984年 《钻石》 1985年 《第一滴血续集》;《洛奇4》 1988年 《第一滴血第三集》 1992年 《龙妈出差》 最差导演 1985年 《洛奇4》 最差剧本 1985年 《第一滴血
  • 遗失的环节《遗失的环节》(英语:)是一部2019年美国定格动画冒险片,由克里斯·巴特勒(英语:Chris Butler (filmmaker))自编自导,莱卡与Annapurna Pictures共同参与制作。其配音员包括休·杰克曼
  • 博杜安国王体育场博杜安国王体育场,原名海塞尔体育场或海塞尔球场,是比利时布鲁塞尔的主要体育场,以比利时国王博杜安命名。海塞尔球场落成于1930年8月23日,由利奥波德三世主持开幕,可容纳7万名观