生成模型

✍ dations ◷ 2025-09-14 11:35:46 #生成模型

在概率统计理论中, 生成模型是指能够随机生成观测数据的模型,尤其是在给定某些隐含参数的条件下。它给观测值和标注数据序列指定一个联合概率分布。在机器学习中,生成模型可以用来直接对数据建模(例如根据某个变量的概率密度函数进行数据采样),也可以用来建立变量间的条件概率分布。条件概率分布可以由生成模型根据贝叶斯定理形成。

香农 (1948) 给出了有一个英语双词频率表生成句子的例子。可以生成如“representing and speedily is an good”这种句子。一开始并不能生成正确的英文句子,但随着词频表由双词扩大为三词甚至多词,生成的句子也就慢慢的成型了。

生成模型的定义与判别模型相对应:生成模型是所有变量的全概率模型,而判别模型是在给定观测变量值前提下目标变量条件概率模型。因此生成模型能够用于模拟(即)模型中任意变量的分布情况,而判别模型只能根据观测变量得到目标变量的采样。判别模型不对观测变量的分布建模,因此它不能够表达观测变量与目标变量之间更复杂的关系。因此,生成模型更适用于无监督的任务,如分类和聚类。

典型的生成模型包括:

如果观测数据是由生成模型中采样的,那么最大化数据似然概率是一个常见的方法。但是,大部分统计模型只是近似于分布,如果任务的目标是在已知一部分变量的值的条件下,对另一部分变量的推断,那么可以认为这种模型近似造成了一些对于当前任务来说不必要的假设。在这种情况下,使用判别模型对条件概率函数建模可能更准确,尽管具体的应用细节会最终决定哪种方法更为适用。

相关

  • 尼基塔·米哈尔科夫金狮奖1992年 《蒙古精神》戛纳影展评审团大奖1994年 《烈日灼身》尼基塔·谢尔盖耶维奇·米亥科夫(俄语:Никита Сергеевич Михалков,转写:Nikita Serge
  • 蛋白激酶A蛋白激酶A(英语:Protein kinase A,简称为PKA)在细胞生物学中是指其活性取决于细胞环腺苷酸(cAMP)水平的一家族酶类。蛋白激酶A也被称为环腺苷酸依赖性蛋白激酶(EC 2.7.11.11)。蛋白
  • 涌泉涌泉位于中国山东省济南市历城区柳埠镇四门塔风景区内,北依白虎山,西侧为涌泉庵遗址,东侧为四门塔,明清时期的《历城县志》称其“在神通寺西,瀑布飞悬,流入锦阳川”。该泉为清代郝
  • 皮尔布拉皮尔布拉(Pilbara)是澳洲西澳州北部的一个面积广大、人口稀少的区域,以境内丰富的铁矿藏而闻名。该区域主要为半干和干燥气候,常年高温,降雨无常,并时常受到夏季气旋的袭击。
  • .mz.mz为莫桑比克国家及地区顶级域(ccTLD)的域名。A .ac .ad .ae .af .ag .ai .al .am .ao .aq .ar .as .at .au .aw .ax .az  B .ba .bb .bd .be .bf .bg .bh .bi .bj .bm .
  • 华莱士 (爱达荷州)华莱士(英语:Wallace)是美国爱达荷州狭长地带肖松尼县的一座历史名城,位处银谷(英语:Silver Valley, Idaho)矿区,是美国的大型银矿区之一,银产量超过美国其他所有的银矿。2010年美国
  • 华岗华岗(1903年6月9日-1972年5月17日),中国浙江省衢州市龙游县人,又名延年、少峰,字西园,曾用名刘少陵、林少侯、潘鸿文,笔名林石父(一作林石夫)、华石修、晓风等,中国现代哲学家、史学家
  • 军舰岛 (北马里亚纳)军舰岛(Mañagaha)是位于塞班岛西侧,周长仅为1.5公里的一个无人小岛。 因二次世界大战时期曾被美军误认为是一艘军舰,又久炸不沉,因而又名“军舰岛”军舰岛距离塞班岛市中心的Gar
  • TrendLabsTrendLabs 是趋势科技的研究、服务与技术支援中心,总部位于菲律宾,且在美国加利福尼亚/洛杉矶、日本东京、台湾台北、法国巴黎、德国慕尼黑与中国有专门的地区性实验室,拥有大
  • 李品芳李品芳(?-1881年),字春皋,浙江东阳县人,清朝政治人物、进士出身。道光三年(1823年),登进士,改庶吉士。道光六年,任翰林院编修。道光十一年,任云南乡试正考官、云南学政。后任少詹事。道光