生成模型

✍ dations ◷ 2025-07-08 16:41:08 #生成模型

在概率统计理论中, 生成模型是指能够随机生成观测数据的模型,尤其是在给定某些隐含参数的条件下。它给观测值和标注数据序列指定一个联合概率分布。在机器学习中,生成模型可以用来直接对数据建模(例如根据某个变量的概率密度函数进行数据采样),也可以用来建立变量间的条件概率分布。条件概率分布可以由生成模型根据贝叶斯定理形成。

香农 (1948) 给出了有一个英语双词频率表生成句子的例子。可以生成如“representing and speedily is an good”这种句子。一开始并不能生成正确的英文句子,但随着词频表由双词扩大为三词甚至多词,生成的句子也就慢慢的成型了。

生成模型的定义与判别模型相对应:生成模型是所有变量的全概率模型,而判别模型是在给定观测变量值前提下目标变量条件概率模型。因此生成模型能够用于模拟(即)模型中任意变量的分布情况,而判别模型只能根据观测变量得到目标变量的采样。判别模型不对观测变量的分布建模,因此它不能够表达观测变量与目标变量之间更复杂的关系。因此,生成模型更适用于无监督的任务,如分类和聚类。

典型的生成模型包括:

如果观测数据是由生成模型中采样的,那么最大化数据似然概率是一个常见的方法。但是,大部分统计模型只是近似于分布,如果任务的目标是在已知一部分变量的值的条件下,对另一部分变量的推断,那么可以认为这种模型近似造成了一些对于当前任务来说不必要的假设。在这种情况下,使用判别模型对条件概率函数建模可能更准确,尽管具体的应用细节会最终决定哪种方法更为适用。

相关

  • 胡聿贤胡聿贤(1922年10月12日-),中国地震工程学家。生于湖北武昌。1946年毕业于上海交通大学土木工程系。1949年获美国密歇根大学土木工程系硕士学位,1952年获博士学位。国家地震局地球
  • 三岛由纪夫三岛由纪夫(日语:三島 由紀夫;假名:みしま ゆきお;平文式罗马字:Mishima Yukio,1925年1月14日-1970年11月25日),本名平冈公威(ひらおか きみたけ),日本小说家、剧作家、记者、电影制作人
  • 圆台圆台,又称截顶圆锥、圆亭,是几何学中研究的一类三维形体,指一个圆锥被平行于它的底面的一个平面所截后,截面与底面之间的几何形体。截面也称为圆台的上底面,原来圆锥的底面称为下
  • 赌城大道赌城大道(Las Vegas Strip,简称:The Strip)是美国内华达州克拉克郡内南拉斯维加斯大道上长约4.2英里(6.8公里)的一个路段。赌城大道并不在拉斯维加斯的城市范围内,而是位于拉斯维加
  • 纳智捷汽车纳智捷汽车股份有限公司(英语:Luxgen Motor Co., Ltd.),简称纳智捷汽车或纳智捷,为台湾的汽车品牌,是裕隆汽车于2008年5月29日所转投资成立的全资子公司,亦为裕隆汽车于2009年1月6
  • 胡美 (医生)胡美(Edward Hicks Hume,1876年5月13日-1957年2月9日),美国传教医师、医学教育家。胡美出生于印度艾哈迈德讷格尔,其父亲与祖父都是在印度的传教士。他于1897年毕业于耶鲁大学并获
  • .hack系列.hack是以旧BANDAI的Project.hack作为中心展开游戏、动画、漫画及电台节目的跨媒体计划。合并后Namco Bandai同样展开.hack Conglomerate的新计划,并以.hack//G.U.为系列总称
  • SageSage是一个覆盖许多数学功能的应用软件,包括代数、组合数学、图论、计算数学、数论、微积分和统计。SAGE的第一个版本在GNU许可证下发布于2005年2月24日,最初的目标是创造一个
  • 林肯海林肯海是北冰洋的一部分,位于北纬80度以北,北以加拿大埃尔斯米尔岛北端的哥伦比亚角和格陵兰岛北端的莫里斯·杰塞普角所在的大圆连线为界,东临万德尔海,北接北冰洋的北极海区。
  • 巴鲁古图巴鲁古图(Barughutu),是印度贾坎德邦Hazaribag县的一个城镇。总人口21091(2001年)。该地2001年总人口21091人,其中男性11321人,女性9770人;0—6岁人口3271人,其中男1728人,女1543人;识