生成模型

✍ dations ◷ 2024-12-23 00:24:07 #生成模型

在概率统计理论中, 生成模型是指能够随机生成观测数据的模型,尤其是在给定某些隐含参数的条件下。它给观测值和标注数据序列指定一个联合概率分布。在机器学习中,生成模型可以用来直接对数据建模(例如根据某个变量的概率密度函数进行数据采样),也可以用来建立变量间的条件概率分布。条件概率分布可以由生成模型根据贝叶斯定理形成。

香农 (1948) 给出了有一个英语双词频率表生成句子的例子。可以生成如“representing and speedily is an good”这种句子。一开始并不能生成正确的英文句子,但随着词频表由双词扩大为三词甚至多词,生成的句子也就慢慢的成型了。

生成模型的定义与判别模型相对应:生成模型是所有变量的全概率模型,而判别模型是在给定观测变量值前提下目标变量条件概率模型。因此生成模型能够用于模拟(即)模型中任意变量的分布情况,而判别模型只能根据观测变量得到目标变量的采样。判别模型不对观测变量的分布建模,因此它不能够表达观测变量与目标变量之间更复杂的关系。因此,生成模型更适用于无监督的任务,如分类和聚类。

典型的生成模型包括:

如果观测数据是由生成模型中采样的,那么最大化数据似然概率是一个常见的方法。但是,大部分统计模型只是近似于分布,如果任务的目标是在已知一部分变量的值的条件下,对另一部分变量的推断,那么可以认为这种模型近似造成了一些对于当前任务来说不必要的假设。在这种情况下,使用判别模型对条件概率函数建模可能更准确,尽管具体的应用细节会最终决定哪种方法更为适用。

相关

  • 郑晓静郑晓静(1958年5月-),女,生于湖北武汉,籍贯浙江乐清,中国力学家,兰州大学教授。1982年毕业于华中科技大学力学系,1984年获该校硕士学位,1987年获兰州大学博士学位,1998年10月起任兰州大
  • 阿波罗17号阿波罗17号(Apollo 17)是美国国家航空航天局的阿波罗计划中的第十一次载人任务,是人类第六次也是迄今为止最后一次登月任务。阿波罗17号是阿波罗计划中唯一的夜间发射的任务,也
  • 等离子体振荡等离子振荡(Plasma oscillation),又称为朗缪尔波(以欧文·朗缪尔命名),是在为等离子或者金属导体中的电子密度的快速振荡。在自由电子气的介电函数中,这种震荡可以被形容为是一种不
  • 浙江潮浙江潮为一杂志名。1903年2月出版于日本东京,月刊,共出十二期(一说十期)。由留学日本的浙江学生同乡会编辑。所载多作反清民族革命的宣传。每期有社说、哲理、历史、地理、大势
  • 耳闸耳闸位于河北区新开河与子牙河交汇处。始建于1919年,其主要目的在于泄洪,也是天津市区最早的水利工程之一。而后于老耳闸之东侧新建新耳闸。目前老耳闸作为古建筑得以保留、其
  • 达西先生费茨威廉·达西(英语:Fitzwilliam Darcy)是简·奥斯汀最著名的小说《傲慢与偏见》里的男主角,在小说里被简称为“达西先生”。他态度冷漠、且为浪漫英雄的典型,并对《傲慢与偏见
  • 克莱夫·卡斯勒克洛斯·埃里克·库斯勒(1931年7月15日-2020年2月24日)是美国冒险小说家,出版了超过70本作品,他以德克·皮特为主角的惊悚小说已经在纽约时报小说畅销书名单20多次,他的其中两部作
  • 墨姓墨姓是中文姓氏之一,在明朝《百家姓续编》中排第494位。在现代是极罕见的姓氏。墨姓有多个来源,主要出于姜姓、子姓:
  • 特里斯特拉姆·亨特特里斯特拉姆·亨特(英语:Tristram Hunt,1974年5月31日-)是英国工党的一位政治人物。2010年,他在中特伦特河畔斯托克选区当选,成为英国下议院议员。他也是玛丽王后学院的历史学教授
  • 麦考利·卡尔金麦考利·卡森·卡尔金(Macaulay Carson Culkin,1980年8月26日-)是一名美国男演员与音乐家。较著名的作品如电影《小鬼当家》(1990年)与续集《小鬼当家2》(1992年),这使他获得极高的知