生成模型

✍ dations ◷ 2025-11-29 12:53:36 #生成模型

在概率统计理论中, 生成模型是指能够随机生成观测数据的模型,尤其是在给定某些隐含参数的条件下。它给观测值和标注数据序列指定一个联合概率分布。在机器学习中,生成模型可以用来直接对数据建模(例如根据某个变量的概率密度函数进行数据采样),也可以用来建立变量间的条件概率分布。条件概率分布可以由生成模型根据贝叶斯定理形成。

香农 (1948) 给出了有一个英语双词频率表生成句子的例子。可以生成如“representing and speedily is an good”这种句子。一开始并不能生成正确的英文句子,但随着词频表由双词扩大为三词甚至多词,生成的句子也就慢慢的成型了。

生成模型的定义与判别模型相对应:生成模型是所有变量的全概率模型,而判别模型是在给定观测变量值前提下目标变量条件概率模型。因此生成模型能够用于模拟(即)模型中任意变量的分布情况,而判别模型只能根据观测变量得到目标变量的采样。判别模型不对观测变量的分布建模,因此它不能够表达观测变量与目标变量之间更复杂的关系。因此,生成模型更适用于无监督的任务,如分类和聚类。

典型的生成模型包括:

如果观测数据是由生成模型中采样的,那么最大化数据似然概率是一个常见的方法。但是,大部分统计模型只是近似于分布,如果任务的目标是在已知一部分变量的值的条件下,对另一部分变量的推断,那么可以认为这种模型近似造成了一些对于当前任务来说不必要的假设。在这种情况下,使用判别模型对条件概率函数建模可能更准确,尽管具体的应用细节会最终决定哪种方法更为适用。

相关

  • 都尔的额我略都尔的圣额我略(拉丁语:Sanctus Gregorius Turonensis,其名额我略也译作格雷戈里和国瑞),(538年11月30日-594年11月17日)是都尔主教及高卢-罗马史学家,也是基督教圣人。他的本名为额我
  • 波尔丁县保尔丁县(Paulding County, Georgia)是美国乔治亚州西北部的一个县。面积1,077平方公里。根据美国2000年人口普查,共有人口81,678人,2005年增至112,411人。县治达拉斯(Dallas)。成
  • 毫安培小时安培小时(英语:Ampere-hour,符号为 A·h,也写作Ah及A h)是电量单位,简称安培时。1安培小时的电量是1安培的电流通电1小时的电量,等于3,600库仑,安培小时不是能量单位,而是电量单位,所
  • 问荆问荆(学名:Equisetum arvense),又名杉菜,为木贼科木贼属下的一个种。多年生草本。暗褐色或黑色的根茎很长,有节,匍匐生根。淡褐色的孢子囊茎,无叶绿素;绿色的营养茎有分枝,直立,下部光
  • 世宗大王朝鲜世宗(朝鲜语:조선 세종/朝鮮世宗 Joseon Sejong;1397年5月7日(阴历4月10日)-1450年4月8日(阴历2月17日)),即朝鲜世宗庄宪大王、朝鲜庄宪国王,朝鲜王朝的第4代国王,1418年至1450年在
  • 盖尔达耶盖尔达耶(阿拉伯语:غرداية‎)位于阿尔及利亚中部姆扎卜谷中心,是盖尔达耶省的首府。
  • 大野郡 (美浓国)大野郡(日语:大野郡/おおのぐん  */?)是日本美浓国及岐阜县辖下的一个郡,下辖1町61村,范围约为今岐阜市一部分,已于1896年4月18日因分割为揖斐郡、本巢郡的一部分而废除郡建置。(
  • 哥德马尔森号商船哥德马尔森号商船(英语:Geldermalsen)是一艘荷兰东印度公司的商船,它最后一次航行时载着茶叶、瓷器和黄金,从中国广州驶往荷兰首都阿姆斯特丹。这艘船在航行了16天后,于1752年1月3
  • 何松亭何松亭(1901年6月2日-1986年2月25日),辽宁昌图人,辽宁大学首任校长。中国人民银行名称的倡议者。生于辽宁省昌图县八面城镇何家洼子村一个贫农家庭。11岁才上小学。小学毕业后到
  • 闸极驱动器闸极驱动器(gate driver)是一种功率放大器,可以让控制集成电路产生的小功率讯号来驱动功率晶体(例如IGBT或是功率级MOSFET)的闸极。闸极驱动器可能是附在功率晶体上,也有可能是独