信号博弈

✍ dations ◷ 2025-04-25 13:03:18 #信号博弈

信号博弈(英语:signaling game),是一种由一个发送者(S)和另一个接收者(R)所组成的动态博弈。一开始这个发送者有一个给定的类型(t),接着发送者会观察这个没有其他人(好比说接收者)知道的类型,去从讯息堆 M = {m1, m2, m3,..., mj} 中选择送出一个讯息(m),接着接收者会观察这个讯息后从他可行的动作中 A = {a1, a2, a3,...., ak} 选一个作为反应动作(a),这里要注意的是接收者除了讯息之外其他都无法得知(如发送者的类型t),接着根据(t, m, a)的组合来决定双方会获得的报酬或回报。

每种类型的发送者发送的消息都满足消息集合M中的概率分布,设 m ( t j ) {\displaystyle m(t_{j})} 表示 t j {\displaystyle t_{j}} 类型的发送者发送M中任意消息的概率。接收者观察到消息m后作出的反应动作 a ( m ) {\displaystyle a^{*}(m)} 也满足行动集合A中的概率分布。

精炼贝叶斯均衡需要满足下面四个条件:

相关

  • 托伦托伦(波兰语:Toruń ;德语:Thorn,托恩)是波兰的一个城市,是1233年由条顿骑士团所建立。属库亚维-波美拉尼亚省。托伦曾是托伦省的省会。托伦的旧市区也是世界文化遗产。托伦在瓜分
  • 扁桃腺结石扁桃腺结石(英语:Tonsilloliths、tonsil stones或tonsilar calculi)是口腔内藏于腭扁桃体(英语:Palatine tonsil)上的钙化物,米粒至爆谷大小,重300毫克(0.011盎司)至42克(1.5盎司),可导致
  • 威斯敏斯特体系威斯敏斯特体系(英语:Westminster system,也译为西敏制),是指沿循英国国会体制,奉行议会至上原则的议会民主制,以其所在威斯敏斯特宫为名。荷兰学者李帕特(Arend Lijphart)归类为“威
  • 埃德雷德埃德雷德(英语:Eadred、Eadred,923年-955年11月23日),长者爱德华与第三任妻子肯特的伊基芙的儿子。兄长爱德蒙一世于946年逝世,埃德雷德于946年5月26日继承为英格兰的国王,直至其于9
  • 和平挪威诺贝尔委员会(挪威语:Den norske Nobelkomité,英语:Norwegian Nobel Committee),是一年一度的诺贝尔和平奖的评定机构。委员会成员有五名,全由挪威议会任命,成员全部是议会的议
  • 用户代理用户代理(英语:User Agent)在计算机科学中指的是代表用户行为的软件代理程序(英语:Software agent)所提供的对自己的一个标识符。例如,一个电子邮件阅读器就是一个电子邮件客户端,而
  • 苋科苋科(学名:Amaranthaceae)包括160属大约2,400种植物,多为草本或灌木,稀有乔木或藤本。苋科广泛分布在全世界,一般分布在亚热带和热带地区,但也有许多种也分布在温带甚至寒温带地区
  • 秋光奏鸣曲《秋光奏鸣曲》(瑞典语:Höstsonaten、英语:Autumn Sonata )是瑞典导演英格玛·伯格曼所执导的1978年电影,是他生涯的代表作之一。Eva是一位家庭主妇,她与丈夫Viktor以及身患残疾
  • 埃塞克斯参数所指定的目标页面不存在,建议更正成存在页面或直接建立下列一个页面(建立前请先搜寻是否有合适的存在页面可以取代):埃塞克斯郡(英语:Essex),英国英格兰东部的郡。以人口计算,滨
  • 风语者《风语者》(英语:Windtalkers)是一部2002年美国战争片,以塞班岛战役时的美国海军陆战队及纳瓦霍族译码员(英语:Code talker)作为题材拍摄,由尼古拉斯·凯奇、亚当·比奇(英语:Adam Bea