信息瓶颈

✍ dations ◷ 2025-12-05 10:54:07 #聚类分析,多变量统计,信息论

信息瓶颈(英语:information bottleneck)是信息论中的一种方法,由纳夫塔利·泰斯比(英语:Naftali Tishby)、费尔南多·佩雷拉(Fernando C. Pereira)与威廉·比亚莱克(英语:William Bialek)于1999年提出。对于一随机变量 X {\displaystyle X} ,假设已知其与观察变量 Y {\displaystyle Y} 之间的联合概率分布 p ( X , Y ) {\displaystyle p(X,Y)} 。此时,当需要概括(聚类) X {\displaystyle X} 时,可以通过信息瓶颈方法来分析如何最优化地平衡准确度与复杂度(数据压缩)。该方法的应用还包括分布聚类(distributional clustering)与降维等。此外,信息瓶颈也被用于分析深度学习的过程。

信息瓶项方法中运用了互信息的概念。假设压缩后的随机变量为 T {\displaystyle T} ,我们试图用 T {\displaystyle T} 代替 X {\displaystyle X} 来预测 Y {\displaystyle Y} 。此时,可使用以下算法得到最优的 T {\displaystyle T}

其中 I ( X ; T ) {\displaystyle I(X;T)} I ( T ; Y ) {\displaystyle I(T;Y)} 分别为 X {\displaystyle X} T {\displaystyle T} 之间、以及 T {\displaystyle T} Y {\displaystyle Y} 之间的互信息,可由 p ( X , Y ) {\displaystyle p(X,Y)} 计算得到。 β {\displaystyle \beta } 则表示拉格朗日乘数。

相关

  • 对齐在文字排版中,对齐(英语:Alignment)是文字或图片依照页面、字段、表格或tab键的排列方法。主要有四种不同的对齐方法:特别注意的是,以上的对齐方式并不会改变文字阅读方向。世界上
  • 非二元性别非二元性别(英语:Non-binary gender)、性别酷儿(英语:genderqueer)和X性别(日语:Xジェンダー)是指一系列不完全是男性或女性的性别认同,这些身份在男性或女性的分类以外。非二元性别可
  • 千金要方《备急千金要方》,简称《千金要方》、《千金方》,唐朝医学家孙思邈著,共三十卷(《道藏》收入时析为93卷),二百三十二门,收集药方五千三百首。撰于公元652年。该书有述有作,验方经方
  • 北喀斯开山北喀斯喀特国家公园(North Cascades National Park),又有人翻译为北瀑布国家公园,美国的一个国家公园,位于华盛顿州北部的霍特科姆县、斯卡吉特县、奇兰县。1968年10月2日成立,总
  • 价格在经济学及营商的过程中,价格是一项以货币为表现形式,为商品、服务及资产所订立的价值数字。在微观经济学之中,资源在需求和供应者之间重新分配的过程中,价格是重要的变数之一。
  • 2015年环法自行车赛2015年环法自行车赛(法语:2015 Tour de France)是第102届环法自行车赛,于2015年7月4日起于荷兰乌得勒支,7月26日结束于巴黎香榭丽舍大道。共有来自22支车队的198名车手进入21赛段
  • 国际动物学会国际动物学会(International Society of Zoological Sciences,简称ISZS)是经中华人民共和国外交部和中国科学技术协会批准,在中华人民共和国民政部正式登记注册的首个学科级国际
  • 托马斯·纳托尔托马斯·纳托尔(Thomas Nuttall,1786年1月5日-1859年9月10日是英国的植物学家和动物学家。纳托尔出生于约克郡塞特尔的一个小村庄,早期到英格兰工作,作为一个印刷学徒工,后来他到
  • 八心八箭八心八箭,又名邱比特车工,是一种钻石的切割技术。将钻石切割出理想切割比例,并进行对称打磨,使光线从钻石的58个瓣面的角度折射出均呈现似八心八箭的特别图案的影像。八心八箭钻
  • 藤田信吉藤田信吉(1559年-1616年7月14日)是日本战国时代、安土桃山时代和江户时代初期的武将,山内上杉氏的家臣,父亲是藤田(小野)康邦(右卫门佐、泰邦)(另有异说)。下野西方藩的初代藩主。自从