生成模型

✍ dations ◷ 2025-06-30 18:18:30 #生成模型

在概率统计理论中, 生成模型是指能够随机生成观测数据的模型,尤其是在给定某些隐含参数的条件下。它给观测值和标注数据序列指定一个联合概率分布。在机器学习中,生成模型可以用来直接对数据建模(例如根据某个变量的概率密度函数进行数据采样),也可以用来建立变量间的条件概率分布。条件概率分布可以由生成模型根据贝叶斯定理形成。

香农 (1948) 给出了有一个英语双词频率表生成句子的例子。可以生成如“representing and speedily is an good”这种句子。一开始并不能生成正确的英文句子,但随着词频表由双词扩大为三词甚至多词,生成的句子也就慢慢的成型了。

生成模型的定义与判别模型相对应:生成模型是所有变量的全概率模型,而判别模型是在给定观测变量值前提下目标变量条件概率模型。因此生成模型能够用于模拟(即)模型中任意变量的分布情况,而判别模型只能根据观测变量得到目标变量的采样。判别模型不对观测变量的分布建模,因此它不能够表达观测变量与目标变量之间更复杂的关系。因此,生成模型更适用于无监督的任务,如分类和聚类。

典型的生成模型包括:

如果观测数据是由生成模型中采样的,那么最大化数据似然概率是一个常见的方法。但是,大部分统计模型只是近似于分布,如果任务的目标是在已知一部分变量的值的条件下,对另一部分变量的推断,那么可以认为这种模型近似造成了一些对于当前任务来说不必要的假设。在这种情况下,使用判别模型对条件概率函数建模可能更准确,尽管具体的应用细节会最终决定哪种方法更为适用。

相关

  • 波涛波浪、波涛是发生在各种水体(海水上的又叫海浪)表面上的表面波,即沿着水与空气界面间传行的一种波动,属于重力波的一种类型。当风吹起时,风所带来的压力及摩擦力对海洋表面的平衡
  • 蔺芳蔺芳(?-1417年),中书省晋宁路解州夏县(今山西省夏县)人,明朝官员。洪武年间,蔺芳因孝廉中举,后累任刑部郎中。永乐年间,出任吉安府知府,为民所爱戴。后因事连坐而贬为办事官,跟从宋礼治会
  • 仁德服务区仁德服务区位于台南市仁德区,里程为中山高速公路335公里,为国道一号最南端的服务区,1979年10月成立,和国道三号关庙服务区一样为南下、北上分开设站,之间由人行陆桥连接,相互贯通,
  • 整体主义整体主义作为诗歌流派由石光华、宋渠、宋炜和杨远宏等诗人于1984年成立。整体主义诗歌创作方法认为人的本质意义在于存在和整体的关联之中,只有整体才是有意义的存在实体,诗歌
  • 铃木俊一 (东京都知事)铃木俊一(1910年11月6日-2010年5月14日),日本政治人物、内务官僚。东京都名誉都民、北京市荣誉市民。1910年,东京府北多摩郡出生。毕业东京帝国大学法学部政治学科,1933年 加入内
  • 奥创奥创(英语:Ultron),是惊奇漫画世界中的超级反派。奥创由罗伊·汤玛斯(英语:Roy Thomas)和约翰·巴斯马(英语:John Buscema)共同创造。首次出现于《复仇者》(Avengers)第55期(1968年八月),他
  • 麦克莱恩冰原岛峰坐标:67°50′S 143°57′E / 67.833°S 143.950°E / -67.833; 143.950麦克莱恩冰原岛峰(英语:McLean Nunataks),是南极洲的冰原岛峰,位于乔治五世地,处于梅尔茨冰川西部,由澳大利
  • 里窝那港里窝那港(意大利语:Porto di Livorno)是在里窝那的意大利最大港口之一,也是地中海沿岸最大的港口之一,每年大约处理30万吨货物和60万个标准货柜。同时里窝那港也提供了超过15,000
  • 赖瑞·艾布什尔赖瑞·艾伦·艾布什尔(英语:Larry Allen Abshier;1943年-1983年7月11日)是在朝鲜战争之后投靠北朝鲜的六名美国士兵之一。他生于美国伊利诺斯州的厄巴纳。艾布什尔于1962年5月在
  • 凯蒂·斯万凯蒂·斯万(英语:Katie Swan,1999年3月24日-)是英国职业网球女运动员,2013年转职业。她的WTA生涯最高单打排名为第432(2016年4月31日)。