信息瓶颈

✍ dations ◷ 2025-10-11 03:00:32 #聚类分析,多变量统计,信息论

信息瓶颈(英语:information bottleneck)是信息论中的一种方法,由纳夫塔利·泰斯比(英语:Naftali Tishby)、费尔南多·佩雷拉(Fernando C. Pereira)与威廉·比亚莱克(英语:William Bialek)于1999年提出。对于一随机变量 X {\displaystyle X} ,假设已知其与观察变量 Y {\displaystyle Y} 之间的联合概率分布 p ( X , Y ) {\displaystyle p(X,Y)} 。此时,当需要概括(聚类) X {\displaystyle X} 时,可以通过信息瓶颈方法来分析如何最优化地平衡准确度与复杂度(数据压缩)。该方法的应用还包括分布聚类(distributional clustering)与降维等。此外,信息瓶颈也被用于分析深度学习的过程。

信息瓶项方法中运用了互信息的概念。假设压缩后的随机变量为 T {\displaystyle T} ,我们试图用 T {\displaystyle T} 代替 X {\displaystyle X} 来预测 Y {\displaystyle Y} 。此时,可使用以下算法得到最优的 T {\displaystyle T}

其中 I ( X ; T ) {\displaystyle I(X;T)} I ( T ; Y ) {\displaystyle I(T;Y)} 分别为 X {\displaystyle X} T {\displaystyle T} 之间、以及 T {\displaystyle T} Y {\displaystyle Y} 之间的互信息,可由 p ( X , Y ) {\displaystyle p(X,Y)} 计算得到。 β {\displaystyle \beta } 则表示拉格朗日乘数。

相关

  • 医师誓言希波克拉底誓词(希腊语:Όρκος του Ιπποκράτη,英语:Hippocratic Oath),俗称医师誓词,是西方医生传统上行医前的誓言,希波克拉底乃古希腊医者,被誉为西方“医学之父”
  • 尿刊酸水合酶结构 / ECOD尿刊酸水合酶(英语:Urocanase或 urocanate hydratase以及imidazolonepropionate hydrolase )是催化组氨酸降解代谢中第二步反应的酶,将尿刊酸水合为咪唑-4-酮-5-丙酸
  • 糖精糖精(Saccharin),学名邻苯甲酰磺酰亚胺,是一种不含有热量的甜味剂。1879年由美国约翰霍普金斯大学化学家Constantin Fahlberg发现。为白色结晶性粉末,难溶于水,对热安定与否仍存在
  • 韩国邮政韩国邮政(朝鲜语:우정사업본부/郵政事業本部)是一家韩国公立事业单位,总部位于韩国世宗特别自治市,主要业务包括邮政、邮政储蓄和保险服务。韩国邮政原由韩国知识经济部管辖。2013
  • 郑武郑武(1967年-),中国篮球运动员,CBA历史上的传奇人物,九十年代中国男篮黄金一代的成员。出生于浙江杭州,祖籍福建莆田梧塘镇。少年时代就进入浙江男篮。司职小前锋,以准确的中远距离
  • 伊莎贝尔·帕特森伊莎贝尔·帕特森(英语:Isabel Paterson,1886年1月22日-1961年1月10日),加裔美籍记者、小说家、政治哲学家,同时代重要的文学批评家。和罗斯·怀尔德·莱茵(英语:Rose Wilder Lane)与
  • 29<< 20212223242526272829>> 29是28与30之间的自然数。
  • 1981年冬季世界大学生运动会第十届冬季世界大学生运动会于1981年2月25日至3月4日在西班牙的哈卡举行。这是西班牙首次主办冬季世界大学生运动会。
  • 施瓦茨堡-鲁多尔施塔特施瓦茨堡-鲁多尔斯塔特(德语:)是德国历史上的一个邦国,位于现在的图林根,首府是鲁多尔施塔特。施瓦茨堡-鲁多尔斯塔特成立于1599年。1815年,施瓦茨堡-鲁多尔施塔特加入德意志邦联
  • 阿克塞尔·施普林格玛莎·埃勒森·梅耶(Martha Else Meyer、结于1933年) 厄娜·佛莉达·柏塔·霍姆(Erna Frieda Berta Holm、结于1939年) 萝丝玛莉·艾尔森(Rosemarie Alsen、结于1953年) 海格尔·