生成模型

✍ dations ◷ 2025-12-01 05:11:21 #生成模型

在概率统计理论中, 生成模型是指能够随机生成观测数据的模型,尤其是在给定某些隐含参数的条件下。它给观测值和标注数据序列指定一个联合概率分布。在机器学习中,生成模型可以用来直接对数据建模(例如根据某个变量的概率密度函数进行数据采样),也可以用来建立变量间的条件概率分布。条件概率分布可以由生成模型根据贝叶斯定理形成。

香农 (1948) 给出了有一个英语双词频率表生成句子的例子。可以生成如“representing and speedily is an good”这种句子。一开始并不能生成正确的英文句子,但随着词频表由双词扩大为三词甚至多词,生成的句子也就慢慢的成型了。

生成模型的定义与判别模型相对应:生成模型是所有变量的全概率模型,而判别模型是在给定观测变量值前提下目标变量条件概率模型。因此生成模型能够用于模拟(即)模型中任意变量的分布情况,而判别模型只能根据观测变量得到目标变量的采样。判别模型不对观测变量的分布建模,因此它不能够表达观测变量与目标变量之间更复杂的关系。因此,生成模型更适用于无监督的任务,如分类和聚类。

典型的生成模型包括:

如果观测数据是由生成模型中采样的,那么最大化数据似然概率是一个常见的方法。但是,大部分统计模型只是近似于分布,如果任务的目标是在已知一部分变量的值的条件下,对另一部分变量的推断,那么可以认为这种模型近似造成了一些对于当前任务来说不必要的假设。在这种情况下,使用判别模型对条件概率函数建模可能更准确,尽管具体的应用细节会最终决定哪种方法更为适用。

相关

  • 太阳中微子缺失问题太阳中微子问题是测量到穿过地球的太阳中微子流量与理论计算相比出现缺失的问题,从1960年代中期持续至约2002年。这种缺失已经被中微子物理的新的认识解决了,这要求对粒子物理
  • 福克斯广播公司福斯广播公司(英语:Fox Broadcasting Company; 简称:Fox,常作全部大写为“FOX”),也被称为“福斯电视网”,是美国一家商业地面电视联播网,为福斯公司的旗舰资产。福斯广播公司的总部
  • 太子储君,君主的法定继承人。根据君主的不同称谓又称皇储、王储或大公储。储君在君主逝世、禅位、逊位后,成为继任君主。是世袭君主制重要的组成部分。在现存的君主制国家中,通常由
  • 为科学游行为科学游行(英语:March for Science、之前被称为“华盛顿特区科学家游行”)是一项在美国华盛顿特区以及全球600多个城市举行的巡游和集会。主办单位透露,本次活动是为了庆祝科学
  • 旺达·兰多芙丝卡旺达·兰多芙丝卡(Wanda Landowska,1879年7月5日-1959年8月16日),波兰裔法国大键琴演奏家。她是首位用大键琴录制巴赫的《哥德堡变奏曲》的音乐家(1931年)。她的出色表演,使得大键琴
  • 西蒙娜·韦伊西蒙娜·韦伊(法语:Simone Weil,法语发音:.mw-parser-output .IPA{font-family:"Charis SIL","Doulos SIL","Linux Libertine","Segoe UI","Lucida Sans Unicode","Code2000","G
  • 唱响中国唱响中国全称“唱响中国——群众最喜爱的新创作歌曲”征集评选活动,是为纪念中国共产党成立90周年,中国中央电视台、中国音乐家协会等单位共同举办的歌曲征选活动。由于其弘扬
  • 谷麦谷麦(英语:Granola,又常称为燕麦、果麦)是一种以燕麦片、坚果、蜂蜜作为原料、经烘烤而成的食物。谷麦经常被当作早餐或零食食用,虽然起源于美国,但在日本等地也颇受欢迎。另外,除
  • 青楼红杏 (1984年电影)参数所指定的目标页面不存在,建议更正成存在页面或直接建立下列一个页面(建立前请先搜寻是否有合适的存在页面可以取代):《青楼红杏》又称《往事追忆录》或《斯万之恋》(法语:;德语
  • 空中杀手《空中杀手》(スカイ・クロラ)是日本作家森博嗣的系列小说作品,后来被改编成动画与游戏。本作品以近未来为舞台,主角是一群战斗机驾驶。战争是故事的主要背景,但关于战争的政治背