生成模型

✍ dations ◷ 2025-06-08 23:51:44 #生成模型

在概率统计理论中, 生成模型是指能够随机生成观测数据的模型,尤其是在给定某些隐含参数的条件下。它给观测值和标注数据序列指定一个联合概率分布。在机器学习中,生成模型可以用来直接对数据建模(例如根据某个变量的概率密度函数进行数据采样),也可以用来建立变量间的条件概率分布。条件概率分布可以由生成模型根据贝叶斯定理形成。

香农 (1948) 给出了有一个英语双词频率表生成句子的例子。可以生成如“representing and speedily is an good”这种句子。一开始并不能生成正确的英文句子,但随着词频表由双词扩大为三词甚至多词,生成的句子也就慢慢的成型了。

生成模型的定义与判别模型相对应:生成模型是所有变量的全概率模型,而判别模型是在给定观测变量值前提下目标变量条件概率模型。因此生成模型能够用于模拟(即)模型中任意变量的分布情况,而判别模型只能根据观测变量得到目标变量的采样。判别模型不对观测变量的分布建模,因此它不能够表达观测变量与目标变量之间更复杂的关系。因此,生成模型更适用于无监督的任务,如分类和聚类。

典型的生成模型包括:

如果观测数据是由生成模型中采样的,那么最大化数据似然概率是一个常见的方法。但是,大部分统计模型只是近似于分布,如果任务的目标是在已知一部分变量的值的条件下,对另一部分变量的推断,那么可以认为这种模型近似造成了一些对于当前任务来说不必要的假设。在这种情况下,使用判别模型对条件概率函数建模可能更准确,尽管具体的应用细节会最终决定哪种方法更为适用。

相关

  • 信号量信号量(英语:semaphore)又称为信号标,是一个同步对象,用于保持在0至指定最大值之间的一个计数值。当线程完成一次对该semaphore对象的等待(wait)时,该计数值减一;当线程完成一次对sem
  • 阿明·哈迪鲍尔阿明·哈迪鲍尔·萨赫拉尼(波斯语:آرمین هادی‌پور صیقلانی‎,1994年8月12日-)是伊朗跆拳道运动员。他曾经获得2017年世界跆拳道锦标赛男子54公斤级银牌及201
  • 吉奥夫·赫斯特吉奥夫·赫斯特爵士,MBE(英语:Sir Geoff Hurst,1941年12月8日—)是在世界杯决赛中上演帽子戏法的唯一一人,现在他已被授予爵位。他最早在西汉姆联是一名边前卫,后来教练罗恩·格林
  • 技术自由意志主义技术自由意志主义(英语:Technolibertarianism),有时称为网络自由意志主义(英语:cyberlibertarianism),是一种起源于1990年代早期硅谷互联网黑客赛博朋克文化和美国自由意志主义的政
  • 伊卡黑石伊卡黑石(Ica Stones),又称伊卡石头、伊卡石,是秘鲁伊卡大区的安山岩民俗工艺品,刻有各种艺术图案卖到外国,后来引发科学骗局而大受观光客欢迎 。 1966年秘鲁人Javier Cabrera建
  • 葛崇德葛崇德(Louis van Dyck,1862年1月21日-1937年12月4日),圣母圣心会会士,天主教蒙古西南境代牧区主教(1915年–1937年)。1862年1月21日,葛崇德生于比利时Loenhout,1882年加入圣母圣心会,1
  • 朱永德 (演员)朱永德(1962年12月2日-),本名林文钧,台湾男演员,2001年演出三立的《台湾阿诚》、《台湾霹雳火》、《世间情》等剧打开知名度。。
  • 小时代2.0虚铜时代《小时代2.0虚铜时代》是中国作家郭敬明第五部长篇小说的第二集, 故事承接《小时代1.0折纸时代》的发展,依旧是以中国上海为背景展开的都市爱情小说。与第一集《小时代1.0折纸
  • 半素数数学中,两个素数的乘积所得的自然数我们称之为半素数(也叫双素数,二次殆素数)。开始的几个半素数是4, 6, 9, 10, 14, 15, 21, 22, 25, 26, ... (OEIS中的数列A001358)它们包含1及
  • 蒼藍流星《蒼藍流星》(原题:蒼き流星SPTレイズナー)是日本的机器人动画。由日本电视台在1985年10月3日至1986年6月26日播放,全38话。1986年发售OVA共3话。