自信息

✍ dations ◷ 2025-08-13 22:22:01 #信息论,信息学熵

在信息论中,自信息(英语:self-information),由克劳德·香农提出,是与概率空间中的单一事件或离散随机变量的值相关的信息量的量度。它用信息的单位表示,例如 bit、nat或是hart,使用哪个单位取决于在计算中使用的对数的底。自信息的期望值就是信息论中的熵,它反映了随机变量采样时的平均不确定程度。

由定义,当信息被拥有它的实体传递给接收它的实体时,仅当接收实体不知道信息的先验知识时信息才得到传递。如果接收实体事先知道了消息的内容,这条消息所传递的信息量就是0。只有当接收实体对消息对先验知识少于100%时,消息才真正传递信息。

因此,一个随机产生的事件 ω n {\displaystyle \omega _{n}} 发生的信息量就等于分别宣告事件 和事件 的信息量的和:

I ( C ) = I ( A B ) = I ( A ) + I ( B ) {\displaystyle \operatorname {I} (C)=\operatorname {I} (A\cap B)=\operatorname {I} (A)+\operatorname {I} (B)} 和 是独立事件,所以 C {\displaystyle C} 的概率为

P ( C ) = P ( A B ) = P ( A ) P ( B ) {\displaystyle \operatorname {P} (C)=\operatorname {P} (A\cap B)=\operatorname {P} (A)\cdot \operatorname {P} (B)}

应用函数 f ( ) {\displaystyle f(\cdot )} 会得到

I ( C ) = I ( A ) + I ( B ) f ( P ( C ) ) = f ( P ( A ) ) + f ( P ( B ) ) = f ( P ( A ) P ( B ) ) {\displaystyle {\begin{aligned}\operatorname {I} (C)&=\operatorname {I} (A)+\operatorname {I} (B)\\f(\operatorname {P} (C))&=f(\operatorname {P} (A))+f(\operatorname {P} (B))\\&=f{\big (}\operatorname {P} (A)\cdot \operatorname {P} (B){\big )}\\\end{aligned}}}

所以函数 f ( ) {\displaystyle f(\cdot )} 有性质

f ( x y ) = f ( x ) + f ( y ) {\displaystyle f(x\cdot y)=f(x)+f(y)}

而对数函数正好有这个性质,不同的底的对数函数之间的区别只差一个常数

f ( x ) = K log ( x ) {\displaystyle f(x)=K\log(x)}

由于事件的概率总是在0和1之间,而信息量必须是非负的,所以 K < 0 {\displaystyle K<0}

考虑到这些性质,假设事件 ω n {\displaystyle \omega _{n}} 发生的几率是 P ( ω n ) {\displaystyle P(\omega _{n})} ,自信息 I ( ω n ) {\displaystyle I(\omega _{n})} 的定义就是:

事件 ω n {\displaystyle \omega _{n}} 的概率越小, 它发生后的自信息量越大。

此定义符合上述条件。在上面的定义中,没有指定的对数的基底:如果以 2 为底,单位是bit。当使用以 e 为底的对数时,单位将是 nat。对于基底为 10 的对数,单位是 hart。

信息量的大小不同于信息作用的大小,这不是同一概念。信息量只表明不确定性的减少程度,至于对接收者来说,所获得的信息可能事关重大,也可能无足轻重,这是信息作用的大小。

熵是离散随机变量的自信息的期望值。但有时候熵也会被称作是随机变量的自信息,可能是因为熵满足 H ( X ) = I ( X ; X ) {\displaystyle \operatorname {H} (X)=\operatorname {I} (X;X)} ,而 I ( X ; X ) {\displaystyle \operatorname {I} (X;X)} X {\displaystyle X} 与它自己的互信息。

相关

  • 环甲肌环甲肌(cricothyroid muscle、环甲状肌、环盾肌)是喉部辅助发声的唯一张力肌肉。它附着于甲状软骨的较低层(英语:Planar lamina)及大角下、以及环状软骨的前外侧,其作用在使甲状腺
  • NusinersenNusinersen(商品名为Spinraza)是第一个用于治疗脊髓性肌肉萎缩症的药物。脊髓性肌肉萎缩症是一种罕见的神经退化性疾病,其病因是自双亲遗传了功能低落或没有功能的SMN基因,因此
  • 非金属非金属元素是元素的一大类,在所有的118种化学元素中,非金属占了23种。在周期表中,除氢以外,其它非金属元素都排在表的右侧和上侧。包括氢、硼、碳、氮、氧、氟、硅、磷、硫、氯
  • 球囊霉目GlomeraceaeClaroideoglomeraceaeGlomales球囊霉目是球囊菌门(Glomeromycota)下的一个内共生真菌种类,能与植物共生,并在植物根中形成丛枝状体及囊泡。此类真菌能和植物互利共
  • 神风连之乱神风连之乱,又称敬神党之乱,是明治时期的士族叛乱。明治维新初期,日本的治安主要是萨摩、长州、土佐等地的武士组成的官军负责,但随倒幕运动发展,明治政府意识到不能只靠未经系统
  • 克隆宝贝《克隆宝贝》(日语:クローン ベイビー)是自2010年10月8日在TBS电视台播出的日本电视剧。
  • 乔治·凯泽格奥尔格·凯泽(Georg Kaiser,1878年11月25日-1945年6月4日),德国多产作家,一生共创作了70多部剧作,许多短篇小说和电影剧本、两部完整的长篇小说、一部未完成的片段以及一些散文作
  • 周丙荣周丙荣(1861年-1915年),字子善,江苏省通州直隶州如皋县人,清朝政治人物、同进士出身。光绪二十一年(1895年),参加光绪乙未科殿试,登进士三甲119名。同年五月,著交吏部掣签分发各省,以知
  • 吉土巴语吉土巴语(Kituba,或译基图巴语)是一种广泛用于中部非洲的通用语。这一语言基于刚果语,是与班图语支关系密切的语言 (其中语言无法互相理解)。它是刚果共和国和刚果民主共和国的官
  • 鹬草鹬草(学名:),又称�草,为禾本科鹬草属下的一种多年生草本植物,广泛分布于欧亚、北非和北美地区,在很多地方是一种入侵植物,生长在水边。其高度可达两米,圆锥花序高30厘米,叶子通常纯绿,偶