生成模型

✍ dations ◷ 2025-11-26 15:07:10 #生成模型

在概率统计理论中, 生成模型是指能够随机生成观测数据的模型,尤其是在给定某些隐含参数的条件下。它给观测值和标注数据序列指定一个联合概率分布。在机器学习中,生成模型可以用来直接对数据建模(例如根据某个变量的概率密度函数进行数据采样),也可以用来建立变量间的条件概率分布。条件概率分布可以由生成模型根据贝叶斯定理形成。

香农 (1948) 给出了有一个英语双词频率表生成句子的例子。可以生成如“representing and speedily is an good”这种句子。一开始并不能生成正确的英文句子,但随着词频表由双词扩大为三词甚至多词,生成的句子也就慢慢的成型了。

生成模型的定义与判别模型相对应:生成模型是所有变量的全概率模型,而判别模型是在给定观测变量值前提下目标变量条件概率模型。因此生成模型能够用于模拟(即)模型中任意变量的分布情况,而判别模型只能根据观测变量得到目标变量的采样。判别模型不对观测变量的分布建模,因此它不能够表达观测变量与目标变量之间更复杂的关系。因此,生成模型更适用于无监督的任务,如分类和聚类。

典型的生成模型包括:

如果观测数据是由生成模型中采样的,那么最大化数据似然概率是一个常见的方法。但是,大部分统计模型只是近似于分布,如果任务的目标是在已知一部分变量的值的条件下,对另一部分变量的推断,那么可以认为这种模型近似造成了一些对于当前任务来说不必要的假设。在这种情况下,使用判别模型对条件概率函数建模可能更准确,尽管具体的应用细节会最终决定哪种方法更为适用。

相关

  • 褐藻褐藻(学名:Phaeophyceae)是属较高等的多细胞藻类,属真核细胞生物,有1,500种左右,主要分布于大陆附近的水域,则淡水种罕见。褐藻纲外表从暗褐色的橄榄绿都有,其取决于褐藻素与叶绿素
  • 磷酸果糖-磷酸果糖激酶(英语Phosphofructokinase;PFK)是一类激酶,可作用于果糖-6-磷酸。可分为两种,分别产生不同产物:EC 1.1/2/3/4/5/6/7/8/9/10/11/12/13/14/15/16/17/18/19/20/21/22  
  • OSPF开放式最短路径优先(英语:Open Shortest Path First,缩写为 OSPF)是一种基于IP协议的路由协议。它是大中型网络上使用较为广泛的IGP协议。OSPF是对链路状态路由协议(英语:Link-sta
  • 系统思维系统思维是一种途径协助人们从宏观角度了解系统,包括了整体结构、模式及周期。相对于笛卡儿及其他人的还原论、哲学分析,它倾向整体主义。因为它关心的是整体及其各部分之间的
  • 性沉溺性成瘾(英语:Sexual addiction),也称性瘾、嗜性、性上瘾或做爱上瘾症,是一种尽管得到了负反馈,依然想要进行性活动(自慰或非直接性交)(特别是性交)的强迫行为。支持为性成瘾症建立一个
  • 罗怡文罗怡文(Yiwen Luo,1963年4月29日-)是中华人民共和国出身的实业家。日本连锁家电行LAOX社长,中文产业株式会社社长。中国上海市出身。上海财经大学毕业后,在上海市第一百货商店担任
  • 侯廷珮侯廷珮(?-?),字长德,陕西宁夏卫籍,明朝政治人物,万历丙戌进士。累官都给事中。万历十四年(1586年),登进士第三甲第一百七名。历官四川犍为县知县。万历二十年(1592年),选兵科给事中。升刑科
  • 郑汝霖郑汝霖(1773年-1835年),号铁侯,福建永泰县治人。清乾隆六十年(1795)乙卯科举人。擅篆隶、篆刻,其作品收录于福建文史丛书《福建印人传》。 与当时陈恭甫、赵谷士等诸名流相友善。家
  • 曲率张量曲率张量可指:
  • 183街车站 (IRT杰罗姆大道线)183街车站(英语:183rd Street station)是纽约地铁IRT杰罗姆大道线高架段的一个慢车地铁站,位于布朗克斯183街及杰罗姆大道交界,设有4号线(任何时候停站)列车服务。此站设有两个侧式月台和三条轨道。中央轨道一般不用于营运。