生成模型

✍ dations ◷ 2025-12-11 07:46:02 #生成模型

在概率统计理论中, 生成模型是指能够随机生成观测数据的模型,尤其是在给定某些隐含参数的条件下。它给观测值和标注数据序列指定一个联合概率分布。在机器学习中,生成模型可以用来直接对数据建模(例如根据某个变量的概率密度函数进行数据采样),也可以用来建立变量间的条件概率分布。条件概率分布可以由生成模型根据贝叶斯定理形成。

香农 (1948) 给出了有一个英语双词频率表生成句子的例子。可以生成如“representing and speedily is an good”这种句子。一开始并不能生成正确的英文句子,但随着词频表由双词扩大为三词甚至多词,生成的句子也就慢慢的成型了。

生成模型的定义与判别模型相对应:生成模型是所有变量的全概率模型,而判别模型是在给定观测变量值前提下目标变量条件概率模型。因此生成模型能够用于模拟(即)模型中任意变量的分布情况,而判别模型只能根据观测变量得到目标变量的采样。判别模型不对观测变量的分布建模,因此它不能够表达观测变量与目标变量之间更复杂的关系。因此,生成模型更适用于无监督的任务,如分类和聚类。

典型的生成模型包括:

如果观测数据是由生成模型中采样的,那么最大化数据似然概率是一个常见的方法。但是,大部分统计模型只是近似于分布,如果任务的目标是在已知一部分变量的值的条件下,对另一部分变量的推断,那么可以认为这种模型近似造成了一些对于当前任务来说不必要的假设。在这种情况下,使用判别模型对条件概率函数建模可能更准确,尽管具体的应用细节会最终决定哪种方法更为适用。

相关

  • 感觉性失语症感觉性失语症 ,又被称为韦尼克氏失语症 , 流畅失语症 ,或接受性失语症。此类患者有语言理解障碍,患者的阅读能力或了解他人谈话内容的能力低下。虽然患者能够说初具语法、速
  • 木卫木星拥有79颗已确认的天然卫星,是太阳系内拥有最大卫星系统的行星。当中最大的4颗,统称伽利略卫星,由伽利略于1610年发现,这是首次(除了月球)发现不是围绕太阳的天体。19世纪末起,
  • 郭振清郭振清(1927年8月-2005年8月24日),男,天津人,中国电影演员。毕业于华北职工干部学校,先后为天津总工会文工团演员,天津艺术剧院演员,长春电影制片厂演员。20世纪五十年代初期,因主演《
  • 索尼半导体制造索尼半导体制造是一家从事半导体设计、开发、制造和提供服务的公司,是索尼集团半导体解决方案的全资子公司。本公司在全球半导体销售排名前20名的公司之一,而目前它在CCD和CMO
  • 刘绵训刘绵训(1880年-1919年),字翼若,山西省猗氏县(今临猗县)李汉乡陈家卓人。清末民初政治人物。刘绵训少学聪颖,曾于令德堂就读。光绪二十八年(1902年),入山西大学堂中斋。光绪二十九年(1903
  • 对氨基苯膦酸对氨基苯膦酸又称4-氨基苯膦酸,是一种有机磷化合物,分子式为C6H8NO3P。对氨基苯膦酸可由对溴苯膦酸在氧化亚铜的存在下和氨水反应得到。
  • 陆以湉陆以湉(1802年-1865年),字薪安,一字定圃,号敬安,浙江桐乡人。陆以湉生于嘉庆六年(1802年),博极群书,中道光十六年丙申(1836年)科进士,分发湖北。以父命改从教职,道光十九年(1839年)为台郡教授
  • 沃尔芬登报告沃尔芬登报告(英语:Wolfenden report),全称有关同性恋和卖淫问题特别调查委员会报告(英语:Report of the Departmental Committee on Homosexual Offences and Prostitution)是1957
  • 涅斯捷罗夫区坐标:54°38′N 22°34′E / 54.633°N 22.567°E / 54.633; 22.567涅斯捷罗夫区(俄语:Нестеровский район),是俄罗斯的一个区,位于该国西北部,由加里宁格勒州负
  • 斯特灵勋爵威廉·亚历山大威廉·亚历山大(英语:William Alexander,1726年12月25日-1783年1月15日),自称斯特灵勋爵(英语:Lord Stirling),美国独立战争时期大陆军将领。亚历山大生于1726年纽约市,家境优厚。亚历