信息瓶颈

✍ dations ◷ 2025-11-09 21:46:22 #聚类分析,多变量统计,信息论

信息瓶颈(英语:information bottleneck)是信息论中的一种方法,由纳夫塔利·泰斯比(英语:Naftali Tishby)、费尔南多·佩雷拉(Fernando C. Pereira)与威廉·比亚莱克(英语:William Bialek)于1999年提出。对于一随机变量 X {\displaystyle X} ,假设已知其与观察变量 Y {\displaystyle Y} 之间的联合概率分布 p ( X , Y ) {\displaystyle p(X,Y)} 。此时,当需要概括(聚类) X {\displaystyle X} 时,可以通过信息瓶颈方法来分析如何最优化地平衡准确度与复杂度(数据压缩)。该方法的应用还包括分布聚类(distributional clustering)与降维等。此外,信息瓶颈也被用于分析深度学习的过程。

信息瓶项方法中运用了互信息的概念。假设压缩后的随机变量为 T {\displaystyle T} ,我们试图用 T {\displaystyle T} 代替 X {\displaystyle X} 来预测 Y {\displaystyle Y} 。此时,可使用以下算法得到最优的 T {\displaystyle T}

其中 I ( X ; T ) {\displaystyle I(X;T)} I ( T ; Y ) {\displaystyle I(T;Y)} 分别为 X {\displaystyle X} T {\displaystyle T} 之间、以及 T {\displaystyle T} Y {\displaystyle Y} 之间的互信息,可由 p ( X , Y ) {\displaystyle p(X,Y)} 计算得到。 β {\displaystyle \beta } 则表示拉格朗日乘数。

相关

  • 可信度信度(英语:Reliability),指的是测量方法的品质,即对同一现象进行重复观察之后是否可以得到相同资料值。科学研究者试图使用一系列的指标来测量个人或社会现象。可信度概念是研究
  • 暴龙超科虚骨龙超科 Coeluroidea Marsh, 1881暴龙超科(学名:Tyrannosauroidea)是肉食性恐龙的一个超科或演化支,属于兽脚亚目的虚骨龙类,并包含暴龙科与其更原始的近亲。暴龙超科最初出现
  • 鳞龙形下纲鳞龙形下纲(学名:Lepidosauromorpha)是一群血缘与蜥蜴较近,离主龙类较远的双孔亚纲动物。唯一存活的次群是鳞龙超目,包括喙头蜥、蛇、蜥蜴。
  • 自主神经紊乱自主神经紊乱,又称自律神经失调 Dysautonomia,就是指自主神经系统的功能异常或者障碍。自主神经系统是指控制人类身体那些自主行为的神经系统。这些保证人类生存的自主行为包
  • 洛伊希滕贝格的约瑟芬洛伊希滕贝格的约瑟芬(法语:Joséphine de Leuchtenberg,1807年3月14日-1876年6月7日)是瑞典王后和国王奥斯卡一世的妻子。她是法兰西第一帝国皇后约瑟芬·德·博阿尔内的孙女,母
  • 帕特里帕特里(Pathri),是印度马哈拉施特拉邦Parbhani县的一个城镇。总人口31997(2001年)。该地2001年总人口31997人,其中男性16467人,女性15530人;0—6岁人口5112人,其中男2630人,女2482人;识
  • 读者听话权读者听话权,媒体术语,用来说明媒体中的受众(阅听人),有决定他听到什么内容的权利,基于这种权利,阅听人不应当仅仅被动接受作者或播报者所提供的资讯,而要藉者对于内容的反省和批判,进
  • 王一鹗王一鹗(1534年-1591年),字子荐,号舂陵,直隶曲周县(今河北省曲周县)城东街人,明朝政治人物。同进士出身。初姓杨。嘉靖三十二年(1553年)癸丑科进士。次年,授南京刑部主事。嘉靖四十年(1561
  • 朱裕壁朱裕璧(1903年-1986年),医学家,医学教育学家,社会活动家。清光绪二十九年生于湖北宜都,民国75年(1986年)于湖北武昌逝世,号楚珍,宜都市五眼泉乡许家台子人,湖北医学院(今武汉大学医学部)
  • 无棘圆鲀无棘圆鲀为辐鳍鱼纲鲀形目四齿鲀亚目四齿鲀科的其中一种,为亚热带海水鱼,分布于东太平洋加利福尼亚湾海域,栖息深度5-20米,体长可达35.2公分,成鱼栖息在沿海沙泥底质底层水域,稚鱼