信息瓶颈

✍ dations ◷ 2025-11-25 01:49:51 #聚类分析,多变量统计,信息论

信息瓶颈(英语:information bottleneck)是信息论中的一种方法,由纳夫塔利·泰斯比(英语:Naftali Tishby)、费尔南多·佩雷拉(Fernando C. Pereira)与威廉·比亚莱克(英语:William Bialek)于1999年提出。对于一随机变量 X {\displaystyle X} ,假设已知其与观察变量 Y {\displaystyle Y} 之间的联合概率分布 p ( X , Y ) {\displaystyle p(X,Y)} 。此时,当需要概括(聚类) X {\displaystyle X} 时,可以通过信息瓶颈方法来分析如何最优化地平衡准确度与复杂度(数据压缩)。该方法的应用还包括分布聚类(distributional clustering)与降维等。此外,信息瓶颈也被用于分析深度学习的过程。

信息瓶项方法中运用了互信息的概念。假设压缩后的随机变量为 T {\displaystyle T} ,我们试图用 T {\displaystyle T} 代替 X {\displaystyle X} 来预测 Y {\displaystyle Y} 。此时,可使用以下算法得到最优的 T {\displaystyle T}

其中 I ( X ; T ) {\displaystyle I(X;T)} I ( T ; Y ) {\displaystyle I(T;Y)} 分别为 X {\displaystyle X} T {\displaystyle T} 之间、以及 T {\displaystyle T} Y {\displaystyle Y} 之间的互信息,可由 p ( X , Y ) {\displaystyle p(X,Y)} 计算得到。 β {\displaystyle \beta } 则表示拉格朗日乘数。

相关

  • 吡喃糖吡喃糖(英语:Pyranose)是一种糖,用于总称碳水化合物所具有的化学结构,其中包含一个由5个碳原子和1个氧原子所组成的六元环状结构。可能会有其他的碳原子在环以外。吡喃糖是吡喃
  • FePOsub4/sub磷酸铁是一种无机化合物,化学式为FePO4。已知有几种相关的物质,包括四晶型的FePO4和双晶型的二水合物FePO4·(H2O)2。这些物质在技术上有几处的应用,同时也能在采矿中见到。FeP
  • 人类 (消歧义)人类(英语:humanity,mankind,man,human beings或terran)可以指:英文中的humanity还可以指:
  • 长冈市长冈市(日语:長岡市/ながおかし Nagaoka shi */?)是位于日本新潟县中部(中越地方)的都市,人口约27万,为新潟县第二大都市、以及中越地方的中心都市,同时是施行时特例市之一。有一般
  • 大洼区大洼区是辽宁省盘锦市下辖的一个区。因地势低洼而得名。秦属辽东郡。东汉置辽东属国,别领昌黎、宾徒、徒河、无虑、险渎、房县六城,房县就在该境。三国时期属魏之平州。晋朝属
  • 关庙服务区关庙服务区位于台湾台南市关庙区布袋里与龙崎区楠坑里交界,里程为福尔摩沙高速公路363.7公里,2001年1月8日成立。主线两侧区分别是南下与北上2部分,设有横跨南北两区之间的行人
  • 尤金·史赖吉 美国第1海军陆战师第二次世界大战尤金·庞杜兰特·史赖吉(Eugene Bondurant Sledge,1923年11月4日-2001年3月3日)是一名美国的名教授与作家,出生于阿拉巴马州的一个富裕家庭。他
  • 陈修信敦陈修信 (Tun Tan Siew Sin,1916年5月21日-1988年3月17日),马来西亚政治人物,曾担任马来西亚财政部长15年以及第三任马华公会总会长,为马华公会创党领袖敦陈祯禄之子。陈修信于191
  • 固铂轮胎固铂轮胎(Cooper Tire & Rubber Company)为美国一家轮胎制造商,于1914年在美国俄亥俄州阿克伦成立。该公司主要产品为汽车与大卡车轮胎,而子公司则专门生产中卡车、机车(特别是竞
  • 白藤江之战 (981年)981年白藤江之战(越南语:Trận Bạch Đằng 981/.mw-parser-output .han-nom{font-family:"Nom Na Tong","Han-Nom Gothic","Han-Nom Ming","HAN NOM A","HAN NOM B","Ming-Lt