生成模型

✍ dations ◷ 2025-05-19 00:34:47 #生成模型

在概率统计理论中, 生成模型是指能够随机生成观测数据的模型,尤其是在给定某些隐含参数的条件下。它给观测值和标注数据序列指定一个联合概率分布。在机器学习中,生成模型可以用来直接对数据建模(例如根据某个变量的概率密度函数进行数据采样),也可以用来建立变量间的条件概率分布。条件概率分布可以由生成模型根据贝叶斯定理形成。

香农 (1948) 给出了有一个英语双词频率表生成句子的例子。可以生成如“representing and speedily is an good”这种句子。一开始并不能生成正确的英文句子,但随着词频表由双词扩大为三词甚至多词,生成的句子也就慢慢的成型了。

生成模型的定义与判别模型相对应:生成模型是所有变量的全概率模型,而判别模型是在给定观测变量值前提下目标变量条件概率模型。因此生成模型能够用于模拟(即)模型中任意变量的分布情况,而判别模型只能根据观测变量得到目标变量的采样。判别模型不对观测变量的分布建模,因此它不能够表达观测变量与目标变量之间更复杂的关系。因此,生成模型更适用于无监督的任务,如分类和聚类。

典型的生成模型包括:

如果观测数据是由生成模型中采样的,那么最大化数据似然概率是一个常见的方法。但是,大部分统计模型只是近似于分布,如果任务的目标是在已知一部分变量的值的条件下,对另一部分变量的推断,那么可以认为这种模型近似造成了一些对于当前任务来说不必要的假设。在这种情况下,使用判别模型对条件概率函数建模可能更准确,尽管具体的应用细节会最终决定哪种方法更为适用。

相关

  • 钼酸铵钼酸铵为白色或淡绿色晶体。工业上一般用辉钼矿(MoS2)焙烧脱硫,用氨水浸出而制得。一般有两种:此外还有:
  • 德·斯戴尔杰曼·德·斯戴尔(Germaine de Staël,1766年4月22日-1817年7月14日),全名安娜·路易斯·杰曼·德·斯戴尔-奥斯丹(Anne Louise Germaine de Staël-Holstein ),以德·斯戴尔夫人而
  • 富邦悍将富邦悍将是一支台湾职业棒球队,隶属于中华职棒,由富邦育乐股份有限公司(富邦金控)经营。主场为新北市立新庄棒球场。前身为义大犀牛。其啦啦队为富邦育乐旗下之Fubon Angels。富
  • 菲利普斯堡菲利普斯堡(荷兰语:Philipsburg)是荷属圣马丁的主要城镇,也是圣马丁岛的行政中心及商业中心。在2006年,该地人口为1,338人。该城镇由苏格兰人约翰·菲利普斯建立于1763年。该地
  • 恩格尔伍德恩格尔伍德(英文:Englewood),是美国科罗拉多州阿拉珀霍县下属的一座城市。建市于1903年5月9日,面积大约为6.644平方英里(17.209平方公里)。根据2010年美国人口普查,该市有人口30,255
  • 考死2:教学实习《考死:血之期中考试2》(朝鲜语:고死 두 번째 이야기: 교생실습 ,英语:),是2010年韩国上映的恐怖电影,为2008年上映的《考死:血之期中考试》之续集,但两者故事并无关联。某私立高中将
  • 克里斯泰什蒂乡 (雅西县)坐标:47°15′N 26°35′E / 47.250°N 26.583°E / 47.250; 26.583克里斯泰什蒂乡(罗马尼亚语:Comuna Cristești, Iași),是罗马尼亚的乡份,位于该国东北部,由雅西县负责管辖,面积
  • 田村美佐子田村美佐子(日语:田村 美佐子 ,1934年4月8日-),日本前女子游泳运动员。她曾参加1952年夏季奥运会游泳比赛,还曾获得1954年亚洲运动会游泳比赛女子400米自由泳金牌。
  • 国防预算国防预算是一个国家为了维持武装力量而支出的费用。在非战争时,或非濒临战争时,国防预算如果占GDP的比例过高,可能引起邻近的国家警戒,而挑起军备竞赛。国防预算包括了:军事费用
  • 弗林德斯 (澳大利亚国会选区)弗林德斯选区(英语:Division of Flinders)是澳大利亚维多利亚州的下议院选区,位于州府墨尔本市中心东南郊。面积1,955平方公里。选区始于1900年,是联邦成立时的七十五个原始选区