生成模型

✍ dations ◷ 2025-04-03 10:45:45 #生成模型

在概率统计理论中, 生成模型是指能够随机生成观测数据的模型,尤其是在给定某些隐含参数的条件下。它给观测值和标注数据序列指定一个联合概率分布。在机器学习中,生成模型可以用来直接对数据建模(例如根据某个变量的概率密度函数进行数据采样),也可以用来建立变量间的条件概率分布。条件概率分布可以由生成模型根据贝叶斯定理形成。

香农 (1948) 给出了有一个英语双词频率表生成句子的例子。可以生成如“representing and speedily is an good”这种句子。一开始并不能生成正确的英文句子,但随着词频表由双词扩大为三词甚至多词,生成的句子也就慢慢的成型了。

生成模型的定义与判别模型相对应:生成模型是所有变量的全概率模型,而判别模型是在给定观测变量值前提下目标变量条件概率模型。因此生成模型能够用于模拟(即)模型中任意变量的分布情况,而判别模型只能根据观测变量得到目标变量的采样。判别模型不对观测变量的分布建模,因此它不能够表达观测变量与目标变量之间更复杂的关系。因此,生成模型更适用于无监督的任务,如分类和聚类。

典型的生成模型包括:

如果观测数据是由生成模型中采样的,那么最大化数据似然概率是一个常见的方法。但是,大部分统计模型只是近似于分布,如果任务的目标是在已知一部分变量的值的条件下,对另一部分变量的推断,那么可以认为这种模型近似造成了一些对于当前任务来说不必要的假设。在这种情况下,使用判别模型对条件概率函数建模可能更准确,尽管具体的应用细节会最终决定哪种方法更为适用。

相关

  • Gilead Sciences吉利德科学公司(Gilead Sciences, Inc.)是一家美国大型生物制药公司,成立于1987年,总部位于加州旧金山湾区的福斯特城。在台湾注册的名称为“吉立亚”。主要生产和研发针对艾滋
  • 檩,亦称为桁、桁条、檩子、檩条,唐宋时称槫,是建筑物中的水平结构件,平行于建筑物的正面,垂直于梁。屋檐的椽木,是垂直地架在檩之上的。《工程作法》九檩楼房《工程作法》六檩楼房
  • 武警特警学院中国人民武装警察部队特种警察学院,简称武警特警学院,位于北京市昌平区,隶属武警总部,是中国人民武装警察部队的特种警察院校,实行“院队合一”体制,既是培养特种作战人才的院校,又
  • 海拉尔河海拉尔河位于中华人民共和国内蒙古自治区东北部,是黑龙江南源额尔古纳河的源流之一,上游称大雁河,发源于内蒙古牙克石市乌尔其汉镇东北大兴安岭西麓的古鲁契那山,蜿蜒向西流经牙
  • 盐溶盐溶(Salting in)是一种物理现象。当一溶液中同时含有蛋白质和离子化合物,提高离子化合物的浓度可提高该蛋白质的溶解度。造成这种现象的原因是当蛋白质盐溶液浓度提高时,因蛋白
  • 帕舒帕蒂纳特庙帕舒帕蒂纳特庙(尼泊尔语:पशुपतिनाथ मन्दिर,拉丁化:Pashupatinath Mandir),位于尼泊尔加德满都东部巴格马蒂河畔,是一座印度教寺庙,也是印度次大陆四大供奉湿婆的寺
  • 彼得·沃洛克彼得·沃洛克(英语:Peter Warlock,1894年10月30日-1930年12月27日),英国作曲家,文学家。真名为菲利普·阿诺德·夏舜霆(Philip Arnold Heseltine),他的音乐及文学作品通常都以笔名发表
  • 吉延普尔吉延普尔(Jiyanpur),是印度北方邦Azamgarh县的一个城镇。总人口10298(2001年)。该地2001年总人口10298人,其中男性4989人,女性5309人;0—6岁人口1944人,其中男1001人,女943人;识字率55.
  • 凹版杂志凹版杂志(日语:グラビア雑誌),简称“凹版志”(グラビア誌),是以绘画兼具摄影内容为中心的杂志统称。与完全摄影写真的写真杂志(日语:写真週刊誌)不是一个概念。因为日本很长一段时间杂
  • 第46届戛纳影展第46届戛纳影展于1993年5月13日至5月24日在法国戛纳举办,开幕片为法国导演安德烈·泰希内执导的《钟爱一生(法语:Ma saison préférée)》,闭幕片则为法国导演菲洛梅纳·艾斯波