自信息

✍ dations ◷ 2024-12-23 05:58:08 #信息论,信息学熵

在信息论中,自信息(英语:self-information),由克劳德·香农提出,是与概率空间中的单一事件或离散随机变量的值相关的信息量的量度。它用信息的单位表示,例如 bit、nat或是hart,使用哪个单位取决于在计算中使用的对数的底。自信息的期望值就是信息论中的熵,它反映了随机变量采样时的平均不确定程度。

由定义,当信息被拥有它的实体传递给接收它的实体时,仅当接收实体不知道信息的先验知识时信息才得到传递。如果接收实体事先知道了消息的内容,这条消息所传递的信息量就是0。只有当接收实体对消息对先验知识少于100%时,消息才真正传递信息。

因此,一个随机产生的事件 ω n {\displaystyle \omega _{n}} 发生的信息量就等于分别宣告事件 和事件 的信息量的和:

I ( C ) = I ( A B ) = I ( A ) + I ( B ) {\displaystyle \operatorname {I} (C)=\operatorname {I} (A\cap B)=\operatorname {I} (A)+\operatorname {I} (B)} 和 是独立事件,所以 C {\displaystyle C} 的概率为

P ( C ) = P ( A B ) = P ( A ) P ( B ) {\displaystyle \operatorname {P} (C)=\operatorname {P} (A\cap B)=\operatorname {P} (A)\cdot \operatorname {P} (B)}

应用函数 f ( ) {\displaystyle f(\cdot )} 会得到

I ( C ) = I ( A ) + I ( B ) f ( P ( C ) ) = f ( P ( A ) ) + f ( P ( B ) ) = f ( P ( A ) P ( B ) ) {\displaystyle {\begin{aligned}\operatorname {I} (C)&=\operatorname {I} (A)+\operatorname {I} (B)\\f(\operatorname {P} (C))&=f(\operatorname {P} (A))+f(\operatorname {P} (B))\\&=f{\big (}\operatorname {P} (A)\cdot \operatorname {P} (B){\big )}\\\end{aligned}}}

所以函数 f ( ) {\displaystyle f(\cdot )} 有性质

f ( x y ) = f ( x ) + f ( y ) {\displaystyle f(x\cdot y)=f(x)+f(y)}

而对数函数正好有这个性质,不同的底的对数函数之间的区别只差一个常数

f ( x ) = K log ( x ) {\displaystyle f(x)=K\log(x)}

由于事件的概率总是在0和1之间,而信息量必须是非负的,所以 K < 0 {\displaystyle K<0}

考虑到这些性质,假设事件 ω n {\displaystyle \omega _{n}} 发生的几率是 P ( ω n ) {\displaystyle P(\omega _{n})} ,自信息 I ( ω n ) {\displaystyle I(\omega _{n})} 的定义就是:

事件 ω n {\displaystyle \omega _{n}} 的概率越小, 它发生后的自信息量越大。

此定义符合上述条件。在上面的定义中,没有指定的对数的基底:如果以 2 为底,单位是bit。当使用以 e 为底的对数时,单位将是 nat。对于基底为 10 的对数,单位是 hart。

信息量的大小不同于信息作用的大小,这不是同一概念。信息量只表明不确定性的减少程度,至于对接收者来说,所获得的信息可能事关重大,也可能无足轻重,这是信息作用的大小。

熵是离散随机变量的自信息的期望值。但有时候熵也会被称作是随机变量的自信息,可能是因为熵满足 H ( X ) = I ( X ; X ) {\displaystyle \operatorname {H} (X)=\operatorname {I} (X;X)} ,而 I ( X ; X ) {\displaystyle \operatorname {I} (X;X)} X {\displaystyle X} 与它自己的互信息。

相关

  • 内毒素内毒素是存在于病原体如细菌内的天然化合物,具有潜在的毒性。一般来说,内毒素不同于外毒素,活的细菌是不会分泌可溶性的内毒素的。内毒素是细菌的结构成分,当细菌被溶解时而被细
  • 粘杆菌素粘杆菌素(Colistin),又名克痢霉素、多粘菌素E,是一种多粘菌素类多肽抗生素,是两种环状多肽——粘杆菌素A和B的混合物。可由多粘芽肥杆菌变种粘菌素(Bacillus polymyxa var. colist
  • 考古考古学(英语:archaeology或archeology,源自古希腊文:ἀρχαιολογία, archaiologia ;ἀρχαῖος,arkhaīos,“古代”;以及-λογία, -logiā,“学问”),对于过去人类
  • 哥本哈根歌剧院哥本哈根歌剧院(Copenhagen Opera House)是丹麦的国家歌剧院,位于哥本哈根市中心的霍尔曼,这座歌剧院也是世界上最现代化的歌剧院之一。哥本哈根歌剧院的修建费用超过5亿美元,也
  • 詹姆斯·皮克詹姆斯·本杰明·皮克(James Benjamin Peake,1944年6月18日),美国退役陆军中将、政治人物,前美国总统乔治·W·布什政府的退伍军人事务部长(2007年至2009年)。
  • 选择透过性半透膜semi-permeable membrane,并不是选透膜selectively permeable membrane,半透膜根据分子/离子的物理特性,例如大小size,电荷charge决定是否可以通过。而物质通过渗透,被动转运
  • 原田要原田要(日语:はらだ かなめ、1916年8月11日-2016年5月3日)是一位出生于日本长野县的第二次世界大战(以下简称二战)王牌飞行员。他在1941年底一直到被击落而身受重伤的1942年10月间
  • 艾伦·卡明艾伦·卡明(英语:Alan Cumming,1965年1月27日-),OBE,是一名苏格兰男演员,亦发展音乐、写作及其他事业。卡明在苏格兰伯斯郡艾柏菲迪(英语:Aberfeldy, Scotland)出生,父亲Alex Cumming为P
  • 工具主义在科学哲学中,工具主义(英语:Instrumentalism)认为科学理论是对于明白和了解世界很有用的工具。工具主义认为去评价一个概念或者理论,应该着眼于其解释和预测现象的能力,而非其形
  • 范家庄乡范家庄乡,是中华人民共和国河北省保定市曲阳县下辖的一个乡镇级行政单位。范家庄乡下辖以下地区:青山村、虎山村、甫塔石村、萄葡口村、杨家台村、完沟村、栗树沟村、上下跑村