自信息

✍ dations ◷ 2025-11-09 16:50:52 #信息论,信息学熵

在信息论中,自信息(英语:self-information),由克劳德·香农提出,是与概率空间中的单一事件或离散随机变量的值相关的信息量的量度。它用信息的单位表示,例如 bit、nat或是hart,使用哪个单位取决于在计算中使用的对数的底。自信息的期望值就是信息论中的熵,它反映了随机变量采样时的平均不确定程度。

由定义,当信息被拥有它的实体传递给接收它的实体时,仅当接收实体不知道信息的先验知识时信息才得到传递。如果接收实体事先知道了消息的内容,这条消息所传递的信息量就是0。只有当接收实体对消息对先验知识少于100%时,消息才真正传递信息。

因此,一个随机产生的事件 ω n {\displaystyle \omega _{n}} 发生的信息量就等于分别宣告事件 和事件 的信息量的和:

I ( C ) = I ( A B ) = I ( A ) + I ( B ) {\displaystyle \operatorname {I} (C)=\operatorname {I} (A\cap B)=\operatorname {I} (A)+\operatorname {I} (B)} 和 是独立事件,所以 C {\displaystyle C} 的概率为

P ( C ) = P ( A B ) = P ( A ) P ( B ) {\displaystyle \operatorname {P} (C)=\operatorname {P} (A\cap B)=\operatorname {P} (A)\cdot \operatorname {P} (B)}

应用函数 f ( ) {\displaystyle f(\cdot )} 会得到

I ( C ) = I ( A ) + I ( B ) f ( P ( C ) ) = f ( P ( A ) ) + f ( P ( B ) ) = f ( P ( A ) P ( B ) ) {\displaystyle {\begin{aligned}\operatorname {I} (C)&=\operatorname {I} (A)+\operatorname {I} (B)\\f(\operatorname {P} (C))&=f(\operatorname {P} (A))+f(\operatorname {P} (B))\\&=f{\big (}\operatorname {P} (A)\cdot \operatorname {P} (B){\big )}\\\end{aligned}}}

所以函数 f ( ) {\displaystyle f(\cdot )} 有性质

f ( x y ) = f ( x ) + f ( y ) {\displaystyle f(x\cdot y)=f(x)+f(y)}

而对数函数正好有这个性质,不同的底的对数函数之间的区别只差一个常数

f ( x ) = K log ( x ) {\displaystyle f(x)=K\log(x)}

由于事件的概率总是在0和1之间,而信息量必须是非负的,所以 K < 0 {\displaystyle K<0}

考虑到这些性质,假设事件 ω n {\displaystyle \omega _{n}} 发生的几率是 P ( ω n ) {\displaystyle P(\omega _{n})} ,自信息 I ( ω n ) {\displaystyle I(\omega _{n})} 的定义就是:

事件 ω n {\displaystyle \omega _{n}} 的概率越小, 它发生后的自信息量越大。

此定义符合上述条件。在上面的定义中,没有指定的对数的基底:如果以 2 为底,单位是bit。当使用以 e 为底的对数时,单位将是 nat。对于基底为 10 的对数,单位是 hart。

信息量的大小不同于信息作用的大小,这不是同一概念。信息量只表明不确定性的减少程度,至于对接收者来说,所获得的信息可能事关重大,也可能无足轻重,这是信息作用的大小。

熵是离散随机变量的自信息的期望值。但有时候熵也会被称作是随机变量的自信息,可能是因为熵满足 H ( X ) = I ( X ; X ) {\displaystyle \operatorname {H} (X)=\operatorname {I} (X;X)} ,而 I ( X ; X ) {\displaystyle \operatorname {I} (X;X)} X {\displaystyle X} 与它自己的互信息。

相关

  • 举重举重是一项历史悠久的运动,将杠铃以双手举过头,以举起的杠铃重量为胜负依据。男子举重在1896年举行的第一届奥林匹克运动会时便已列为正式项目。虽然早在1987年世界举重锦标赛
  • 水蒸气压水蒸气压通常指水的饱和蒸气压,是水蒸气与其凝聚态处于热力学平衡时蒸气的压强。在混合气体中,饱和水蒸气压为与液态或固态水处于平衡态的水蒸气的分压。饱和水蒸气压是温度的
  • 右苯丙胺右旋安非他命(英语:Dextroamphetamine)是强力中枢神经兴奋剂,也是苯丙胺(“安非他命”) 的对映异构体,是注意力不足过动症(ADHD)和发作性嗜睡病的处方药。此外,它也被用作提升运动员能
  • 环境友善环境友善(又称环境友好、自然友善或绿色友好)一词用来指一个商品、服务、建筑、法律或政策对环境所造成的损害较少。此外,为了让消费者能够了解,通常受认证的环境友好商品或服务
  • 帕特罗克洛斯帕特罗克洛斯(Patroclus,也名Patroklos,希腊文Πάτροκλος),取意“父亲的荣耀”。在希腊神话中,被记载于荷马(Homer)所著的伊里亚德(Iliad)。Menoetius之子,阿基里斯(Achilles)的
  • 鲁纳鲁纳(英语:Runa)是美国西弗吉尼亚州尼古拉斯县一个非建制地区,海拔675米(2275英尺)以及距离县治萨默斯维尔(Summersville)以南约9.5英里(15.3千米),并以早期一位殖民者的姐妹鲁纳·麦克
  • 遗传学分支遗传学,它涉及基因的分子结构和功能,以及细胞或生物体(如支配地位和表观遗传学)背景下的基因行为、从父系到后代的遗传模式以及基因分布、变异和种群变化。
  • 山县伊三郎山县伊三郎(1858年2月6日-1927年9月24日),日本政治人物。曾任递信大臣、韩国副统监等职。为元老山县有朋之养子,后来继承了其公爵之位。旧姓胜津。妻为加藤弘之之女隆子。儿子是
  • 文美惠文美惠(1931年-),湖北武汉人,毕业于北京大学西语系,民盟党员,中国大陆女性翻译家。文美惠主要翻译英国小说家罗德亚德·吉卜林的作品。文美惠丈夫林洪亮,波兰文学翻译家。
  • 成华区成华区是中国四川省成都市中心城区即五城区之一。1991年1月1日成都市区划调整,设立五个主城区,成华区是其中之一。成华区在历史上曾分属原成都县、华阳县,故以成都、华阳两地名