生成模型

✍ dations ◷ 2025-03-07 10:14:21 #生成模型

在概率统计理论中, 生成模型是指能够随机生成观测数据的模型,尤其是在给定某些隐含参数的条件下。它给观测值和标注数据序列指定一个联合概率分布。在机器学习中,生成模型可以用来直接对数据建模(例如根据某个变量的概率密度函数进行数据采样),也可以用来建立变量间的条件概率分布。条件概率分布可以由生成模型根据贝叶斯定理形成。

香农 (1948) 给出了有一个英语双词频率表生成句子的例子。可以生成如“representing and speedily is an good”这种句子。一开始并不能生成正确的英文句子,但随着词频表由双词扩大为三词甚至多词,生成的句子也就慢慢的成型了。

生成模型的定义与判别模型相对应:生成模型是所有变量的全概率模型,而判别模型是在给定观测变量值前提下目标变量条件概率模型。因此生成模型能够用于模拟(即)模型中任意变量的分布情况,而判别模型只能根据观测变量得到目标变量的采样。判别模型不对观测变量的分布建模,因此它不能够表达观测变量与目标变量之间更复杂的关系。因此,生成模型更适用于无监督的任务,如分类和聚类。

典型的生成模型包括:

如果观测数据是由生成模型中采样的,那么最大化数据似然概率是一个常见的方法。但是,大部分统计模型只是近似于分布,如果任务的目标是在已知一部分变量的值的条件下,对另一部分变量的推断,那么可以认为这种模型近似造成了一些对于当前任务来说不必要的假设。在这种情况下,使用判别模型对条件概率函数建模可能更准确,尽管具体的应用细节会最终决定哪种方法更为适用。

相关

  • 梵王梵天(梵语:Brahmā,义为清净、离欲),又称大梵天王或大梵天(梵语:Mahā-brahmā(-deva),义为大梵天;音译为摩诃梵)、梵天主、净天、梵童子(梵语:Brahmā-sanaṃkumāra)、娑婆世界主(梵语:Br
  • 南昌西环铁路中华人民共和国南昌西环铁路,又称为南昌铁路西环线、南昌枢纽西环线、南昌铁路枢纽西环线是一条货运线路,起点终点均连接到京九线,通车后货运列车可以不用经过南昌城区,从而解决
  • 维西小檗维西小檗(学名:)为小檗科小檗属的植物,为中国的特有植物。分布于中国大陆的云南等地,生长于海拔2,000米的地区,常生长在河边以及路旁,目前尚未由人工引种栽培。
  • 陆秉枢陆秉枢(?-1862年),字辰吉,号纶斋,一号眉生,浙江桐乡乌镇人。清朝翰林、政治人物。陆秉枢幼时有“神童”之称,十三岁入庠,学使陈用光对其十分赏识,并亲自做媒,聘同乡提军汪道诚之女为妻,成
  • 军事历史学军事历史学是历史学的一个分支,同时也是军事学的一个分支。军事历史学是指以军事史作参考,对现时的情况实行适当的军事部署,这有助避免在军事史上犯过的错误。同时,军事历史学可
  • 方小方方小方(1951年12月-),四川成都人,中华人民共和国政治人物。1984年加入中国共产党。四川师范学院(现四川师范大学)数学系函授学习毕业,大学学历。历任广汉市副市长;四川嘉陵国际实业有
  • 剪舌麻雀《剪舌麻雀》(日语:舌切り雀)是日本的一则童话故事。很久很久以前,在某地住着一对老夫妇,老爷爷很温柔的对待前来玩耍的小麻雀,并给它们食物吃,可是老奶奶却很不高兴,很不满意老爷爷
  • 高志龙属高志龙属(学名:)是日本早白垩世北谷组(英语:Kitadani Formation)的一属原始鸭嘴龙超科。该属的发现表明,早白垩世亚洲东部边缘的鸭嘴龙具有较高的多样性。属名“高志”是指一个古代
  • 迪奥多·罗赛克迪奥多·罗赛克(Theodore Roethke,IPA: ; RET-key,1908年5月25日-1963年8月1日) 美国诗人,他发表过数卷具有节奏感和自然景象的诗集。1954年,以诗集《苏醒》(The Waking)获得普利
  • 侯应琛侯应琛(?-?),字献之,号晋阳,河南开封府杞县人。父侯于赵,嘉靖四十四年进士,山西巡抚,天启二年追赠都察院右都御史。弟侯应瑜,字珮之,杞县人,万历二十八年庚子举人,丁未署固始教谕,累迁泰安州知州,庚申报最,迁浙江严州郡丞,改济南郡丞,仍管泰安州事,次年遇妖党徐鸿儒倡乱,应瑜规画捍御,以大义激发人心,贼闻有备引去。又有刘三才者,聚众谋不轨,应瑜立斩渠魁,馀皆解散。时邻邑焚戮甚惨,惟泰安一州称安堵焉。升刑部员外,癸亥迁本部郎中,应诏上封事,语多指斥宦官,出为郧阳知府,当事以考功法中之,三月解绶罢归。崇祯初,