信息瓶颈

✍ dations ◷ 2025-11-25 14:42:32 #聚类分析,多变量统计,信息论

信息瓶颈(英语:information bottleneck)是信息论中的一种方法,由纳夫塔利·泰斯比(英语:Naftali Tishby)、费尔南多·佩雷拉(Fernando C. Pereira)与威廉·比亚莱克(英语:William Bialek)于1999年提出。对于一随机变量 X {\displaystyle X} ,假设已知其与观察变量 Y {\displaystyle Y} 之间的联合概率分布 p ( X , Y ) {\displaystyle p(X,Y)} 。此时,当需要概括(聚类) X {\displaystyle X} 时,可以通过信息瓶颈方法来分析如何最优化地平衡准确度与复杂度(数据压缩)。该方法的应用还包括分布聚类(distributional clustering)与降维等。此外,信息瓶颈也被用于分析深度学习的过程。

信息瓶项方法中运用了互信息的概念。假设压缩后的随机变量为 T {\displaystyle T} ,我们试图用 T {\displaystyle T} 代替 X {\displaystyle X} 来预测 Y {\displaystyle Y} 。此时,可使用以下算法得到最优的 T {\displaystyle T}

其中 I ( X ; T ) {\displaystyle I(X;T)} I ( T ; Y ) {\displaystyle I(T;Y)} 分别为 X {\displaystyle X} T {\displaystyle T} 之间、以及 T {\displaystyle T} Y {\displaystyle Y} 之间的互信息,可由 p ( X , Y ) {\displaystyle p(X,Y)} 计算得到。 β {\displaystyle \beta } 则表示拉格朗日乘数。

相关

  • 沿岸流沿岸流(英语:longshore current)是指波浪推向岸边,有时波峰列(波列)并不平行海岸线,两者形成的夹角,一波一波的波浪推动成一股贴岸而行的海流。近岸水流的流动方向与碎波区底床地形.
  • 西弗兰克西法兰克王国(法语:Francie occidentale)为西欧的一个君主制国家,存在时间为843年至987年。843年,法兰克国王虔诚者路易的三个儿子,洛泰尔、日耳曼人路易及秃头查理签署《凡尔登条
  • 经济观察报《经济观察报》(The Economic Observer)是山东三联集团有限责任公司投资人民币4000万元、2001年4月16日在北京创刊的经济类周报,立报准则是理性、建设性。每逢周一出版发行。目
  • 苏云金芽孢杆菌苏云金芽孢杆菌(学名:Bacillus thuringiensis,专著中简称为Bt),又称苏力菌,是革兰氏阳性的,芽孢杆菌属陆生习性的细菌。另外, 苏云金芽孢杆菌可寄生在一些蛾类和蝶类的幼虫上,甚至
  • 哈伯法哈伯法(也称哈伯-博施法,德文:Haber-Bosch-Verfahren,英文:Haber Process,也称Haber-Bosch process或Fritz-Haber Process)是通过氮气及氢气产生氨气(NH3)的过程。氮气及氢气在200个
  • 李芳硕李芳硕(1382年-1398年),朝鲜王朝开国之君太祖李成桂第八子,母显妃康氏。高丽禑王八年(1382年)生于松都,李成桂及康氏第二子。朝鲜太祖元年(1392年)八月,立为世子。七年(1398年)八月,靖安君
  • 肃慎语肃慎,亦称息慎、稷慎,是夏代及商代生活在黑水(今黑龙江)和松花江流域一带的一个部族。与汉族、濊貊、东胡同被称为古代东北地区及外满洲的四大民族,也是中国东北地区最早被中国古
  • 匈牙利边界围栏 参与边界围栏运作的国家匈牙利边界围栏建于2015年,位于匈牙利与塞尔维亚和克罗地亚接壤的边界。匈牙利在欧洲移民危机恶化后修建该围栏,以加强边境安全,阻止移民以非法途径进
  • 也迪古也迪古(1352年-1419年),白帐汗国曼吉特部首领。他也曾参与建立诺盖汗国。阿拉伯作家伊本.阿拉伯沙说他是汗国宫廷侍卫长。他来自克里米亚曼吉特人,他父亲1378年被脱脱迷失杀害。
  • 邓有功邓有功(1210年-1279年),字子大,号月巢,人称月巢先生,南宋江西南丰人,自幼习儒,后为天心正法祖师爷饶洞天之五传弟子。邓有功校对核本,改正错谬之处,进而有《上清骨髓灵文鬼律》三卷与《