自信息

✍ dations ◷ 2025-02-23 19:43:43 #信息论,信息学熵

在信息论中,自信息(英语:self-information),由克劳德·香农提出,是与概率空间中的单一事件或离散随机变量的值相关的信息量的量度。它用信息的单位表示,例如 bit、nat或是hart,使用哪个单位取决于在计算中使用的对数的底。自信息的期望值就是信息论中的熵,它反映了随机变量采样时的平均不确定程度。

由定义,当信息被拥有它的实体传递给接收它的实体时,仅当接收实体不知道信息的先验知识时信息才得到传递。如果接收实体事先知道了消息的内容,这条消息所传递的信息量就是0。只有当接收实体对消息对先验知识少于100%时,消息才真正传递信息。

因此,一个随机产生的事件 ω n {\displaystyle \omega _{n}} 发生的信息量就等于分别宣告事件 和事件 的信息量的和:

I ( C ) = I ( A B ) = I ( A ) + I ( B ) {\displaystyle \operatorname {I} (C)=\operatorname {I} (A\cap B)=\operatorname {I} (A)+\operatorname {I} (B)} 和 是独立事件,所以 C {\displaystyle C} 的概率为

P ( C ) = P ( A B ) = P ( A ) P ( B ) {\displaystyle \operatorname {P} (C)=\operatorname {P} (A\cap B)=\operatorname {P} (A)\cdot \operatorname {P} (B)}

应用函数 f ( ) {\displaystyle f(\cdot )} 会得到

I ( C ) = I ( A ) + I ( B ) f ( P ( C ) ) = f ( P ( A ) ) + f ( P ( B ) ) = f ( P ( A ) P ( B ) ) {\displaystyle {\begin{aligned}\operatorname {I} (C)&=\operatorname {I} (A)+\operatorname {I} (B)\\f(\operatorname {P} (C))&=f(\operatorname {P} (A))+f(\operatorname {P} (B))\\&=f{\big (}\operatorname {P} (A)\cdot \operatorname {P} (B){\big )}\\\end{aligned}}}

所以函数 f ( ) {\displaystyle f(\cdot )} 有性质

f ( x y ) = f ( x ) + f ( y ) {\displaystyle f(x\cdot y)=f(x)+f(y)}

而对数函数正好有这个性质,不同的底的对数函数之间的区别只差一个常数

f ( x ) = K log ( x ) {\displaystyle f(x)=K\log(x)}

由于事件的概率总是在0和1之间,而信息量必须是非负的,所以 K < 0 {\displaystyle K<0}

考虑到这些性质,假设事件 ω n {\displaystyle \omega _{n}} 发生的几率是 P ( ω n ) {\displaystyle P(\omega _{n})} ,自信息 I ( ω n ) {\displaystyle I(\omega _{n})} 的定义就是:

事件 ω n {\displaystyle \omega _{n}} 的概率越小, 它发生后的自信息量越大。

此定义符合上述条件。在上面的定义中,没有指定的对数的基底:如果以 2 为底,单位是bit。当使用以 e 为底的对数时,单位将是 nat。对于基底为 10 的对数,单位是 hart。

信息量的大小不同于信息作用的大小,这不是同一概念。信息量只表明不确定性的减少程度,至于对接收者来说,所获得的信息可能事关重大,也可能无足轻重,这是信息作用的大小。

熵是离散随机变量的自信息的期望值。但有时候熵也会被称作是随机变量的自信息,可能是因为熵满足 H ( X ) = I ( X ; X ) {\displaystyle \operatorname {H} (X)=\operatorname {I} (X;X)} ,而 I ( X ; X ) {\displaystyle \operatorname {I} (X;X)} X {\displaystyle X} 与它自己的互信息。

相关

  • 帕纳雷阿岛帕纳雷阿岛(Panarea)是西西里岛以北的火山岛岛链,伊奥利亚群岛8个岛中面积第2小的岛屿(仅大于巴西卢佐岛)。岛上常住人口约280人,但是在夏季,随着游客大量涌入,人口会戏剧性增长。近
  • 美国化学学会美国化学学会(英语:American Chemical Society,简称为ACS)是一个化学领域的专业组织。1876年于美国纽约大学成立,现有157,000位来自化学与化工界各个分支的会员,总部位于华盛顿哥
  • 旋转旋转在几何和线性代数中是描述刚体围绕一个固定点的运动的在平面或空间中的变换。旋转不同于没有固定点的平移,和翻转变换的形体的反射。旋转和上面提及的变换是等距的,它们保
  • 旺代省旺代省(法文:Vendée)是法国卢瓦尔河地区大区所辖的省份。该省编号为85。5个海外省及大区
  • 纸张纸是任何纤维经排水作用后,在帘模上交织成薄页揭下干燥后的成品。纸是书写、印刷的载体,也可以作为包装、卫生等其他用途,如打印纸、复写纸、卫生纸、面纸等等。古代的纸有各种
  • 清远清远市(官方音译:Qingyuan,传统外文:Tsingyün),简称清,别称凤城,是中华人民共和国广东省下辖的地级市,位于广东省中部偏北。市境东邻韶关市,东南接广州市,南界佛山市,西连肇庆市、广西
  • 热力学数据一氧化碳的一些性质如下所述。一氧化碳的安全技术说明书(MSDS)可以参见此页面。不指明时,均指标准状态。其余信息参见Wikipedia:化学信息框。
  • 鹞形鹞形,在台湾称作鸢形,在中国大陆称为筝形,是一个四边形,特点为:“鹞形”二字中的“鹞”为风筝之意,因为鹞形是简单的风筝形状,故风筝又称作“纸鹞”。鹞形的面积为对角线相乘的一半
  • STRO-1STRO-1是一个常用的间充质干细胞标记蛋白,分子量为75kD(千道尔顿)。STRO-1这个名称最早于1990年代提出,最初是用来指一种抗CD34+(阳性)间充质干细胞的单克隆抗体系。名称STRO-1中S
  • 汉斯·劳辛汉斯·劳辛爵士,KBE(瑞典语:Sir Hans Rausing,1926年3月25日-2019年8月30日),瑞典商人,在英国从商。他通过继承其父创立的利乐公司公司而发家。该公司目前是世界上最大的食品包装公