生成模型

✍ dations ◷ 2025-11-27 14:45:46 #生成模型

在概率统计理论中, 生成模型是指能够随机生成观测数据的模型,尤其是在给定某些隐含参数的条件下。它给观测值和标注数据序列指定一个联合概率分布。在机器学习中,生成模型可以用来直接对数据建模(例如根据某个变量的概率密度函数进行数据采样),也可以用来建立变量间的条件概率分布。条件概率分布可以由生成模型根据贝叶斯定理形成。

香农 (1948) 给出了有一个英语双词频率表生成句子的例子。可以生成如“representing and speedily is an good”这种句子。一开始并不能生成正确的英文句子,但随着词频表由双词扩大为三词甚至多词,生成的句子也就慢慢的成型了。

生成模型的定义与判别模型相对应:生成模型是所有变量的全概率模型,而判别模型是在给定观测变量值前提下目标变量条件概率模型。因此生成模型能够用于模拟(即)模型中任意变量的分布情况,而判别模型只能根据观测变量得到目标变量的采样。判别模型不对观测变量的分布建模,因此它不能够表达观测变量与目标变量之间更复杂的关系。因此,生成模型更适用于无监督的任务,如分类和聚类。

典型的生成模型包括:

如果观测数据是由生成模型中采样的,那么最大化数据似然概率是一个常见的方法。但是,大部分统计模型只是近似于分布,如果任务的目标是在已知一部分变量的值的条件下,对另一部分变量的推断,那么可以认为这种模型近似造成了一些对于当前任务来说不必要的假设。在这种情况下,使用判别模型对条件概率函数建模可能更准确,尽管具体的应用细节会最终决定哪种方法更为适用。

相关

  • 前庭球前庭球(英语:vestibular bulbs),也被称之为阴蒂球(clitoral bulbs),是一类勃起组织的集合,它位于阴蒂的内侧。它位于阴道前庭,接近于阴蒂、阴蒂脚,并在尿道、尿道海绵(英语:urethral spo
  • 钡剂吞咽检查法钡餐是硫酸钡乳液,可以辅助X-射线成像。硫酸钡乳液被患者喝下去之后可以附着在消化道管壁上,阻挡X射线穿过,常用于显示食管和胃的形态。硫酸钡不会被消化,最终会和粪便一起排出
  • 爱达荷领地爱达荷领土徽章(1863-1866)爱达荷领地(英语:Idaho Territory)是美国历史上的一个合并建制领土,存在于1836年3月4日至1890年7月3日之间。爱达荷领地的领土系由俄勒冈领地、华盛顿领
  • 君特·贝克·冯·曼那哥塔-勒驰奈君特·贝克·冯·曼那哥塔-勒驰奈(Günther Ritter Beck von Mannagetta und Lerchenau,1856年8月25日-1931年6月23日)是著名的奥地利植物学家。他的父亲是国家检察官。1878年他
  • 震源深度震源深度指震源到地面的铅直距离,根据震源深度不同,可将天然地震分为浅源地震、中源地震和深源地震三种:
  • 白石村遗址白石村遗址遗址位于中国山东省烟台市芝罘区,以发掘地为白石村而得名。该遗址也是新石器时代白石文化的命名遗址,该遗址并列入中国于2006年6月公布的第六批全国重点文物保护单
  • 陆华裕陆华裕(1964年—),中国银行家,曾任宁波银行行长、董事长。浙江宁波人,1964年9月出生。1981年9月至1985年7月,在杭州商学院(今浙江工商大学)财务与会计学院会8103班学习。毕业于中华
  • VPN屏蔽VPN屏蔽技术用于屏蔽虚拟专用网(VPN)所使用的加密隧道协议通讯方式,屏蔽者多为国家政府或公司等大型组织。目的可能是确保计算机安全,也可能是通过阻止用户使用VPN绕过网络防火
  • 艾蒂安·里绍艾蒂安·里绍 (法语:Étienne Antoine Guillaume Richaud,艾蒂安·安托万·纪尧姆·里绍),法国政治人物。1841年1月11日出生于法国罗讷河口省的马蒂格 ,1889年5月31日死于孟加拉湾
  • 杂波杂波(或称杂斑,英语:clutter)一词用来描述电子系统中多余(不需要)的回波(echo)。雷达相关领域尤其常用这个词。这类型的回波通常来自地面、海洋、雨水,或者动物、昆虫以及大气紊流等,