信息瓶颈

✍ dations ◷ 2025-05-19 11:57:26 #聚类分析,多变量统计,信息论

信息瓶颈(英语:information bottleneck)是信息论中的一种方法,由纳夫塔利·泰斯比(英语:Naftali Tishby)、费尔南多·佩雷拉(Fernando C. Pereira)与威廉·比亚莱克(英语:William Bialek)于1999年提出。对于一随机变量 X {\displaystyle X} ,假设已知其与观察变量 Y {\displaystyle Y} 之间的联合概率分布 p ( X , Y ) {\displaystyle p(X,Y)} 。此时,当需要概括(聚类) X {\displaystyle X} 时,可以通过信息瓶颈方法来分析如何最优化地平衡准确度与复杂度(数据压缩)。该方法的应用还包括分布聚类(distributional clustering)与降维等。此外,信息瓶颈也被用于分析深度学习的过程。

信息瓶项方法中运用了互信息的概念。假设压缩后的随机变量为 T {\displaystyle T} ,我们试图用 T {\displaystyle T} 代替 X {\displaystyle X} 来预测 Y {\displaystyle Y} 。此时,可使用以下算法得到最优的 T {\displaystyle T}

其中 I ( X ; T ) {\displaystyle I(X;T)} I ( T ; Y ) {\displaystyle I(T;Y)} 分别为 X {\displaystyle X} T {\displaystyle T} 之间、以及 T {\displaystyle T} Y {\displaystyle Y} 之间的互信息,可由 p ( X , Y ) {\displaystyle p(X,Y)} 计算得到。 β {\displaystyle \beta } 则表示拉格朗日乘数。

相关

  • 副极地低压副极地低压位于北纬60度和南纬60度。从极地高压带流向低纬的气流,在南北纬60度附近与盛行西风相遇,形成锋面。相对暖而轻的西风气流爬升到高空,形成副极地上升气流。上升气流在
  • 渡边多惠子渡边多惠子(1960年8月29日-),日本漫画家。东京都出身。血型AB型。1979年以‘和佳ちゃんの熱愛時代’出道。体验了美国寄宿生活后,以男孩子气的美国少女菲儿为主角,于小学馆“别册
  • 菠菜甾醇α-菠菜甾醇(英语:α-Spinasterol)是一种存在于许多植物中的豆甾烷型植物固醇,最早在菠菜 (spinach)中发现,因而得名。菠菜甾醇最近在一种大头茶属植物 Gordonia ceylanica 中发现
  • 德国联邦内政、建设和家园部德国联邦内政部(德语:Bundesministerium des Innern,简称BMI)是德国联邦政府的部委之一,主办公室位于柏林,另在波恩设有第二办公区。内政部的职责是维护国内安全与宪政秩序、保护
  • TAS2R14味觉感受器,类型2,成员14,TAS2R14 是一个人类基因组中基因编码的蛋白质,是苦味味觉感受器的一员。该基因所属的味觉感受器家族是G蛋白偶联受体超家族中的一员,其蛋白主要表达在舌
  • 五氯化铀五氯化铀是一种无机化合物,化学式为UCl5,有放射性。五氯化铀可以通过四氯化铀在520℃的直接氯化得到:这个反应可逆。三氯化硼和UF5·3SbF5在40℃反应也可得到五氯化铀:五氯化铀
  • IBSF世界台球锦标赛IBSF世界台球锦标赛(IBSF World Billiards Championship),旧称世界业余台球锦标赛(World Amateur Billiards Championship),是英式台球的首要国际业余赛事。该活动的历史可追溯至1
  • 日新大桥日新大桥(越南语:Cầu Nhật Tân/.mw-parser-output .han-nom{font-family:"Nom Na Tong","Han-Nom Gothic","Han-Nom Ming","HAN NOM A","HAN NOM B","Ming-Lt-HKSCS-UNI-H",
  • 藤田信吉藤田信吉(1559年-1616年7月14日)是日本战国时代、安土桃山时代和江户时代初期的武将,山内上杉氏的家臣,父亲是藤田(小野)康邦(右卫门佐、泰邦)(另有异说)。下野西方藩的初代藩主。自从
  • Chloe克萝伊(Chloe,中国大陆常译科洛,Chloë, Cloe, Chlöe, Chloé, Clowy, Kloe, Khloe, Khloë, Khloé, Kloé or Kloë)是女性名字,在英国尤其常见。法语形式为Chloé。Chloe源自