自信息

✍ dations ◷ 2025-05-18 10:23:12 #信息论,信息学熵

在信息论中,自信息(英语:self-information),由克劳德·香农提出,是与概率空间中的单一事件或离散随机变量的值相关的信息量的量度。它用信息的单位表示,例如 bit、nat或是hart,使用哪个单位取决于在计算中使用的对数的底。自信息的期望值就是信息论中的熵,它反映了随机变量采样时的平均不确定程度。

由定义,当信息被拥有它的实体传递给接收它的实体时,仅当接收实体不知道信息的先验知识时信息才得到传递。如果接收实体事先知道了消息的内容,这条消息所传递的信息量就是0。只有当接收实体对消息对先验知识少于100%时,消息才真正传递信息。

因此,一个随机产生的事件 ω n {\displaystyle \omega _{n}} 发生的信息量就等于分别宣告事件 和事件 的信息量的和:

I ( C ) = I ( A B ) = I ( A ) + I ( B ) {\displaystyle \operatorname {I} (C)=\operatorname {I} (A\cap B)=\operatorname {I} (A)+\operatorname {I} (B)} 和 是独立事件,所以 C {\displaystyle C} 的概率为

P ( C ) = P ( A B ) = P ( A ) P ( B ) {\displaystyle \operatorname {P} (C)=\operatorname {P} (A\cap B)=\operatorname {P} (A)\cdot \operatorname {P} (B)}

应用函数 f ( ) {\displaystyle f(\cdot )} 会得到

I ( C ) = I ( A ) + I ( B ) f ( P ( C ) ) = f ( P ( A ) ) + f ( P ( B ) ) = f ( P ( A ) P ( B ) ) {\displaystyle {\begin{aligned}\operatorname {I} (C)&=\operatorname {I} (A)+\operatorname {I} (B)\\f(\operatorname {P} (C))&=f(\operatorname {P} (A))+f(\operatorname {P} (B))\\&=f{\big (}\operatorname {P} (A)\cdot \operatorname {P} (B){\big )}\\\end{aligned}}}

所以函数 f ( ) {\displaystyle f(\cdot )} 有性质

f ( x y ) = f ( x ) + f ( y ) {\displaystyle f(x\cdot y)=f(x)+f(y)}

而对数函数正好有这个性质,不同的底的对数函数之间的区别只差一个常数

f ( x ) = K log ( x ) {\displaystyle f(x)=K\log(x)}

由于事件的概率总是在0和1之间,而信息量必须是非负的,所以 K < 0 {\displaystyle K<0}

考虑到这些性质,假设事件 ω n {\displaystyle \omega _{n}} 发生的几率是 P ( ω n ) {\displaystyle P(\omega _{n})} ,自信息 I ( ω n ) {\displaystyle I(\omega _{n})} 的定义就是:

事件 ω n {\displaystyle \omega _{n}} 的概率越小, 它发生后的自信息量越大。

此定义符合上述条件。在上面的定义中,没有指定的对数的基底:如果以 2 为底,单位是bit。当使用以 e 为底的对数时,单位将是 nat。对于基底为 10 的对数,单位是 hart。

信息量的大小不同于信息作用的大小,这不是同一概念。信息量只表明不确定性的减少程度,至于对接收者来说,所获得的信息可能事关重大,也可能无足轻重,这是信息作用的大小。

熵是离散随机变量的自信息的期望值。但有时候熵也会被称作是随机变量的自信息,可能是因为熵满足 H ( X ) = I ( X ; X ) {\displaystyle \operatorname {H} (X)=\operatorname {I} (X;X)} ,而 I ( X ; X ) {\displaystyle \operatorname {I} (X;X)} X {\displaystyle X} 与它自己的互信息。

相关

  • 毛利人毛利人(Māori)是新西兰境内的原住民,属于南岛语族波利尼西亚人。其民族语言原本没有文字,1840年开始以拉丁字母作为民族语言之文字。民族信仰数泛灵的多神信仰。“Māori”这个
  • 韦伯韦伯是国际单位制中磁通量的导出单位,缩写Wb,是以德国物理学家威廉·韦伯的名字命名的。1Wb = 1V·s = 108 Mx (麦克斯韦)1韦伯为一匝线圈其磁通量在1秒内均匀递减至零而产生1伏
  • 霍华德德怀特·大卫·霍华德(英语:Dwight David Howard,1985年12月8日-),出生于佐治亚州亚特兰大,外号“魔兽”,目前效力于NBA洛杉矶湖人。德怀特·霍华德生于美国佐治亚州亚特兰大。其父
  • 脾细胞脾细胞(英语:splenocyte)是在脾脏中的单核细胞,是免疫系统的一员。单核细胞是五种主要的白细胞之一。(注:Splenocyte照字面翻译为“脾细胞”,但不建议翻成中文。)
  • 全氟丁烷全氟丁烷(英语:Perfluorobutane,缩写PFB,IUPAC名为十氟丁烷(Decafluorobutane)是分子式为C4F10的一种氟碳化合物(英语:fluorocarbon),是正丁烷的全氟衍生物,可取代三氟溴甲烷(哈龙1301)作
  • 棋王棋王可以指:
  • 玻璃种玻璃种,按照翡翠的“水头”划分而得的翡翠种类,是透明度最高的翡翠。玻璃种呈全透明或半透明,肉眼观察似玻璃质地,晶莹剔透,又常泛有“荧光”。“水头”是指翡翠的透明度,行业内一
  • 莎拉·蔻娜莎拉·蔻娜(德语:Sarah Connor)(1980年1月13日-),知名畅销独声德国流行音乐歌手。莎拉于2000年代初期便在欧洲走红。莎拉曾与马克·特伦兹(英语:Marc Terenzi)成婚,并拥有一子一女,特勒
  • 温泉街道 (安宁市)温泉街道是中国云南省昆明市安宁市下辖的一个街道办事处。原为温泉镇,2011年4月安宁市正式在全域撤镇设街道办事处,改为街道办事处。地处安宁城区以北8公里处,距昆明市区40公里
  • 迁西构造期迁西构造期,简称迁西期,是古太古代(36-32亿年前)期间的构造期,在此期间,在今中国及周边地区发生了迁西运动或称迁西事件。迁西运动是以河北迁西县命名的,在内蒙古也叫兴和运动。迁