生成模型

✍ dations ◷ 2025-11-25 00:06:50 #生成模型

在概率统计理论中, 生成模型是指能够随机生成观测数据的模型,尤其是在给定某些隐含参数的条件下。它给观测值和标注数据序列指定一个联合概率分布。在机器学习中,生成模型可以用来直接对数据建模(例如根据某个变量的概率密度函数进行数据采样),也可以用来建立变量间的条件概率分布。条件概率分布可以由生成模型根据贝叶斯定理形成。

香农 (1948) 给出了有一个英语双词频率表生成句子的例子。可以生成如“representing and speedily is an good”这种句子。一开始并不能生成正确的英文句子,但随着词频表由双词扩大为三词甚至多词,生成的句子也就慢慢的成型了。

生成模型的定义与判别模型相对应:生成模型是所有变量的全概率模型,而判别模型是在给定观测变量值前提下目标变量条件概率模型。因此生成模型能够用于模拟(即)模型中任意变量的分布情况,而判别模型只能根据观测变量得到目标变量的采样。判别模型不对观测变量的分布建模,因此它不能够表达观测变量与目标变量之间更复杂的关系。因此,生成模型更适用于无监督的任务,如分类和聚类。

典型的生成模型包括:

如果观测数据是由生成模型中采样的,那么最大化数据似然概率是一个常见的方法。但是,大部分统计模型只是近似于分布,如果任务的目标是在已知一部分变量的值的条件下,对另一部分变量的推断,那么可以认为这种模型近似造成了一些对于当前任务来说不必要的假设。在这种情况下,使用判别模型对条件概率函数建模可能更准确,尽管具体的应用细节会最终决定哪种方法更为适用。

相关

  • rDNA核糖体DNA(Ribosomal DNA,rDNA)是一种DNA序列,该序列用于rRNA编码。核糖体是蛋白质和rRNA分子的组合,翻译mRNA分子以产生蛋白质的组件。如该图所示,真核生物的rDNA包括一个单元段,
  • 东帝汶总统东帝汶总统即为东帝汶国家元首。东帝汶实行议会制,总统是国家名义上的元首,通过普选产生,任期5年。
  • 魏景蒙魏景蒙(1907年8月28日-1982年10月7日),为中国近代著名记者及新闻从业员,浙江省杭州市人,魏易第三个儿子,生于北京;曾任中华民国第六任行政院新闻局局长及总统府国策顾问。其外孙女为
  • 1970年夏季世界大学生运动会1970年夏季世界大学生运动会是第六届夏季世界大学生运动会,于1970年8月26日至9月6日在意大利都灵举行,这是该地时隔11年再次举行该赛事。葡萄牙里斯本原本获得1969年赛事主办
  • 杨少华杨少华(1932年-),北京人,在家排行老四。从艺五十余年,是一位比较勤奋的相声捧哏演员。他曾为马三立和马志明捧过哏,但是一直没有红起来。直到与赵伟洲合作《枯木逢春》以来才逐渐形
  • 托马斯·巴赫托马斯·巴赫(德语:Thomas Bach,1953年12月29日-),生于西德维尔茨堡,德国击剑运动员,体育官员,2013年9月接替雅克·罗格当选国际奥林匹克委员会主席,曾任国际奥委会副主席,长期负责奥委
  • 烤麸焅麸,常讹写作烤麸,是以生面筋为原料,经保温、发酵、高温蒸制而成,为常见的素食食材。呈褐黄色,多气孔有点像海绵,口感松软有弹性。常见于江浙菜品中的烤麸做法是“四喜烤麸”(四喜
  • ComicStudioComicStudio,是一款由日本CELSYS公司(日语:セルシス)开发的漫画原稿制作软件。日文原版由日本CELSYS公司于2001年制作并发布1.0版系列,2002年发布1.5版系列,2003年发布2.0版系列,20
  • 塞西莉亚·穆尼奥斯-帕尔玛塞西莉亚·穆尼奥斯-帕尔玛(英语:Cecilia Muñoz-Palma;1913年11月22日-2006年1月2日),菲律宾法学家,独裁者费迪南德·马科斯统治时期的反对派领袖,是菲律宾最高法院首位女法官,1986
  • 加文·冈宁 加文·祖德·冈宁(英语:Gavin Jude Gunning,1991年1月29日-)是一名爱尔兰足球运动员,主要司职中卫,现效力英格兰足球全国联赛南俱乐部格洛斯特城。冈宁在2006年1月加入布莱克本