生成模型

✍ dations ◷ 2025-11-23 05:42:22 #生成模型

在概率统计理论中, 生成模型是指能够随机生成观测数据的模型,尤其是在给定某些隐含参数的条件下。它给观测值和标注数据序列指定一个联合概率分布。在机器学习中,生成模型可以用来直接对数据建模(例如根据某个变量的概率密度函数进行数据采样),也可以用来建立变量间的条件概率分布。条件概率分布可以由生成模型根据贝叶斯定理形成。

香农 (1948) 给出了有一个英语双词频率表生成句子的例子。可以生成如“representing and speedily is an good”这种句子。一开始并不能生成正确的英文句子,但随着词频表由双词扩大为三词甚至多词,生成的句子也就慢慢的成型了。

生成模型的定义与判别模型相对应:生成模型是所有变量的全概率模型,而判别模型是在给定观测变量值前提下目标变量条件概率模型。因此生成模型能够用于模拟(即)模型中任意变量的分布情况,而判别模型只能根据观测变量得到目标变量的采样。判别模型不对观测变量的分布建模,因此它不能够表达观测变量与目标变量之间更复杂的关系。因此,生成模型更适用于无监督的任务,如分类和聚类。

典型的生成模型包括:

如果观测数据是由生成模型中采样的,那么最大化数据似然概率是一个常见的方法。但是,大部分统计模型只是近似于分布,如果任务的目标是在已知一部分变量的值的条件下,对另一部分变量的推断,那么可以认为这种模型近似造成了一些对于当前任务来说不必要的假设。在这种情况下,使用判别模型对条件概率函数建模可能更准确,尽管具体的应用细节会最终决定哪种方法更为适用。

相关

  • 立体渲染立体渲染(英语:Volume rendering),又称为体绘制,是一种用于显示离散三维采样数据集的二维投影的技术。一个典型的三维数据集是CT或者MRI采集的一组二维切面图像。通常这些数据是
  • 制糖制糖是制造食糖的产业,原料来源为甘蔗或甜菜,因其产品的体积远小于原料,是一种原料区位的产业,目前生产糖最多的国家是古巴。全世界糖业的大规模发展与地理大发现有关,欧洲人在西
  • 配糖键糖苷键(英语:Glycosidic bond,旧称配糖键)是指特定类型的化学键,连接糖苷分子中的非糖部分(即苷元)与糖基,或者糖基与糖基。含有配糖键的物质称为糖苷(或配糖体)。根据与糖基异头碳原
  • 王磊王磊(1986年8月12日-),中国年轻篮球运动员。出生于山东济南,11岁被送到河南焦作少年体校开始接触正规篮球。2003年同易建联,唐正东,张庆鹏等人一起入选国青队,2008年,2009年两次入选
  • 2008年5月逝世人物列表2008年5月逝世人物列表,是用于汇总2008年5月期间逝世人物的列表。
  • 斯蒂芬·朗斯蒂芬·朗(英语:Stephen Lang,1952年7月11日-),是美国的一名男演员和剧作家。他发迹于百老汇的剧院,但却因其在《战役风云》中饰演的石墙杰克逊和在《阿凡达》中饰演的夸里奇上校
  • 非人哉《非人哉》是一部在微博、有妖气、网易漫画上连载的四格多格漫画,由漫画家一汪空气绘制,原名《什么鬼》。 本作从2015年8月21日开始在官方微博连载,并于2016年4月1日上架有妖气
  • 金应凤金应凤(16世纪-17世纪),字瑞庭,浙江绍兴府山阴县人,明朝政治人物。金应凤是万历二十二年(1594年)的举人,二十六年(1598年)成进士,获授深州知州,在当地赈灾、清除盗贼巢穴、处理水患、捕捉
  • 梁汝笏梁汝笏(越南语:Lương Nhữ Hốt/.mw-parser-output .han-nom{font-family:"Nom Na Tong","Han-Nom Gothic","Han-Nom Ming","HAN NOM A","HAN NOM B","Ming-Lt-HKSCS-UNI-H",
  • 琴宝罗琴宝罗(韩语:금보라,1961年1月7日-),韩国女演员。