生成模型

✍ dations ◷ 2025-11-24 05:20:51 #生成模型

在概率统计理论中, 生成模型是指能够随机生成观测数据的模型,尤其是在给定某些隐含参数的条件下。它给观测值和标注数据序列指定一个联合概率分布。在机器学习中,生成模型可以用来直接对数据建模(例如根据某个变量的概率密度函数进行数据采样),也可以用来建立变量间的条件概率分布。条件概率分布可以由生成模型根据贝叶斯定理形成。

香农 (1948) 给出了有一个英语双词频率表生成句子的例子。可以生成如“representing and speedily is an good”这种句子。一开始并不能生成正确的英文句子,但随着词频表由双词扩大为三词甚至多词,生成的句子也就慢慢的成型了。

生成模型的定义与判别模型相对应:生成模型是所有变量的全概率模型,而判别模型是在给定观测变量值前提下目标变量条件概率模型。因此生成模型能够用于模拟(即)模型中任意变量的分布情况,而判别模型只能根据观测变量得到目标变量的采样。判别模型不对观测变量的分布建模,因此它不能够表达观测变量与目标变量之间更复杂的关系。因此,生成模型更适用于无监督的任务,如分类和聚类。

典型的生成模型包括:

如果观测数据是由生成模型中采样的,那么最大化数据似然概率是一个常见的方法。但是,大部分统计模型只是近似于分布,如果任务的目标是在已知一部分变量的值的条件下,对另一部分变量的推断,那么可以认为这种模型近似造成了一些对于当前任务来说不必要的假设。在这种情况下,使用判别模型对条件概率函数建模可能更准确,尽管具体的应用细节会最终决定哪种方法更为适用。

相关

  • 贾莱斯·吉尔伯特·斯科特贾莱斯·吉尔伯特·斯科特爵士 OM(英语:Sir Giles Gilbert Scott,1880年11月9日-1960年2月8日),20世纪英国著名建筑师,英国皇家建筑学院院士。最为人所知的作品包含利物浦座堂、滑
  • 卡拉巴萨斯卡拉巴萨斯(英文:Calabasas),是美国加利福尼亚州洛杉矶县下属的一座城市,位于圣费尔南多谷以西、圣莫尼卡山的西北方,毗邻阿古拉山、希登希尔斯、马里布。建市于1991年4月5日,面积
  • Fairfield费尔菲尔德(英语:Fairfield)是美国康乃狄克州费尔菲尔德县的一个城镇,南临长岛海湾。面积81,1平方公里。2000年人口57,340人,2006年人口57,829人。 2006年7月曾被美国金钱月刊选
  • 经世济民中文的经济出自东晋时代葛洪《抱朴子・内篇》中的“经世济俗”,意为治理天下,救济百姓。隋朝王通在《文中子・礼乐篇》则将提出了“经济”一词:“皆有经济之道,谓经国济民”。后
  • 江灿腾江灿腾,(1946年11月3日-),台湾桃园市大溪区人,佛教学者。毕业于国立台湾师范大学历史系夜间部,国立台湾大学历史研究所硕士与博士。曾在国立台湾大学、国立清华大学与北台湾科技学
  • 水莲雾水莲雾又名水蒲桃(学名:)、水雾莲、番鬼葡萄、番鬼佬葡萄等,为桃金娘科蒲桃属下的一个种。
  • Apple WatchApple Watch是苹果公司开发的一款智能手表。
  • 西伯利亚鸢尾西伯利亚鸢尾(学名:)是鸢尾科鸢尾属的植物。分布于欧洲以及中国大陆的江苏、湖北、江西等地,目前已由人工引种栽培。
  • 长崎县知事列表长崎县知事列表包括长崎县的历代县令、知事(官选:38代38人/公选:16代6人)。
  • 盖埃达姆盖埃达姆(Geedam),是印度恰蒂斯加尔邦Dantewada县的一个城镇。总人口5899(2001年)。该地2001年总人口5899人,其中男性3032人,女性2867人;0—6岁人口814人,其中男426人,女388人;识字率65