信息瓶颈

✍ dations ◷ 2025-11-21 00:56:33 #聚类分析,多变量统计,信息论

信息瓶颈(英语:information bottleneck)是信息论中的一种方法,由纳夫塔利·泰斯比(英语:Naftali Tishby)、费尔南多·佩雷拉(Fernando C. Pereira)与威廉·比亚莱克(英语:William Bialek)于1999年提出。对于一随机变量 X {\displaystyle X} ,假设已知其与观察变量 Y {\displaystyle Y} 之间的联合概率分布 p ( X , Y ) {\displaystyle p(X,Y)} 。此时,当需要概括(聚类) X {\displaystyle X} 时,可以通过信息瓶颈方法来分析如何最优化地平衡准确度与复杂度(数据压缩)。该方法的应用还包括分布聚类(distributional clustering)与降维等。此外,信息瓶颈也被用于分析深度学习的过程。

信息瓶项方法中运用了互信息的概念。假设压缩后的随机变量为 T {\displaystyle T} ,我们试图用 T {\displaystyle T} 代替 X {\displaystyle X} 来预测 Y {\displaystyle Y} 。此时,可使用以下算法得到最优的 T {\displaystyle T}

其中 I ( X ; T ) {\displaystyle I(X;T)} I ( T ; Y ) {\displaystyle I(T;Y)} 分别为 X {\displaystyle X} T {\displaystyle T} 之间、以及 T {\displaystyle T} Y {\displaystyle Y} 之间的互信息,可由 p ( X , Y ) {\displaystyle p(X,Y)} 计算得到。 β {\displaystyle \beta } 则表示拉格朗日乘数。

相关

  • 相对主义相对主义是一种主张没有绝对,只有相对的理论类型。其共同的主题是:经验、思想、价值,甚至是实在之中的一些主要方面总是相对于其他东西而成立的,但原因却不清楚。例如,正当理由、
  • 泄殖腔膜泄殖腔膜(cloacal membrane)是一个在泌尿生殖器官发育期间,覆盖胚胎泄殖腔的薄膜。它由外胚层发展,并与内胚层彼此接触 。随着人类胚胎和尾折持续生长,直肠间隔将泄殖腔分为腹侧
  • 葡萄糖-6-磷酸葡萄糖-6-磷酸(英语:Glucose 6-phosphate),也称6-磷酸葡萄糖,是葡萄糖经过磷酸化(在第6号碳)之后生成的分子。它也是生物细胞中的常见分子,参与磷酸戊糖途径与糖酵解等生化途径。在
  • 砂轮砂轮是一个消耗的各种研磨(砂轮切割)和磨削加工操作中使用的磨料化合物组成的。砂轮一般由粗颗粒的磨料化合物黏合在一起,以形成一个固体的圆形物体,可根据车轮的用途挑选各种型
  • 水泥埋尸事件女子高中生水泥埋尸案(或称绫濑水泥杀人事件)是1988年11月至1989年1月发生在日本东京都足立区绫濑(日语:綾瀬 (足立区))的绑票、禁锢、强奸、性虐待、暴行罪(日语:重傷害)、谋杀和死
  • 世仇血亲复仇或血族复仇是古代盛行于阿拉伯半岛的一种原始习俗。某个氏族内部的成员受到其他氏族的侵害时,将被认为是对这个氏族全体成员的伤害。如果经过调停后未取得和解,就会引
  • 肉碱肉碱 (carnitine),或音译卡尼丁,是一种类氨基酸,属于季铵阳离子复合物,可以透过生物合成方法从离胺酸及甲硫胺酸两种氨基酸合成产生。肉碱存在有两个立体异构:包括有生物活跃的L-
  • 磁偶极矩磁矩是磁铁的一种物理性质。处于外磁场的磁铁,会感受到力矩,促使其磁矩沿外磁场的磁场线方向排列。磁矩可以用矢量表示。磁铁的磁矩方向是从磁铁的指南极指向指北极,磁矩的大小
  • 米特胡恩·查克拉博蒂米特胡恩·查克拉博蒂(印地语:मिथुन चक्रबर्ती、孟加拉语:মিঠুন চক্রবর্তী、乌尔都语:متھن چکرورتی‎‎)为印度的演员、歌手、制作人、
  • 桔带裸颊鲷桔带裸颊鲷,又称橘带龙占,为辐鳍鱼纲鲈形目鲈亚目龙占鱼科的其中一种,分布于印度太平洋区,从红海、东非至萨摩亚群岛海域,栖息深度可达30米,本鱼身体是浅黄褐色或橄榄色至棕色,越靠