生成模型

✍ dations ◷ 2025-11-27 22:01:02 #生成模型

在概率统计理论中, 生成模型是指能够随机生成观测数据的模型,尤其是在给定某些隐含参数的条件下。它给观测值和标注数据序列指定一个联合概率分布。在机器学习中,生成模型可以用来直接对数据建模(例如根据某个变量的概率密度函数进行数据采样),也可以用来建立变量间的条件概率分布。条件概率分布可以由生成模型根据贝叶斯定理形成。

香农 (1948) 给出了有一个英语双词频率表生成句子的例子。可以生成如“representing and speedily is an good”这种句子。一开始并不能生成正确的英文句子,但随着词频表由双词扩大为三词甚至多词,生成的句子也就慢慢的成型了。

生成模型的定义与判别模型相对应:生成模型是所有变量的全概率模型,而判别模型是在给定观测变量值前提下目标变量条件概率模型。因此生成模型能够用于模拟(即)模型中任意变量的分布情况,而判别模型只能根据观测变量得到目标变量的采样。判别模型不对观测变量的分布建模,因此它不能够表达观测变量与目标变量之间更复杂的关系。因此,生成模型更适用于无监督的任务,如分类和聚类。

典型的生成模型包括:

如果观测数据是由生成模型中采样的,那么最大化数据似然概率是一个常见的方法。但是,大部分统计模型只是近似于分布,如果任务的目标是在已知一部分变量的值的条件下,对另一部分变量的推断,那么可以认为这种模型近似造成了一些对于当前任务来说不必要的假设。在这种情况下,使用判别模型对条件概率函数建模可能更准确,尽管具体的应用细节会最终决定哪种方法更为适用。

相关

  • 工笔画工笔画,是中国画的一种画法,讲究技法工整细致。工笔画可以细分为工笔白描和工笔重彩两大类,前者不用色,单以墨勾勒图画,代表作有李公麟的《五马图》,后者用重彩颜料,所谓重彩即为天
  • 斯拉夫民族斯拉夫人(英语:Slavic peoples)是欧洲各民族和语言集团中人数最多的之一,有三亿四千万人。主要分布于东欧和中欧,语言属于斯拉夫语族。 斯拉夫人发源于今波兰东南部维斯杜拉河上
  • 让·佩兰让·巴蒂斯特·佩兰(法语:Jean Baptiste Perrin,1870年9月30日-1942年4月17日),法国物理学家,生于法国里尔。1926年诺贝尔物理学奖获得者。让·巴蒂斯特·佩兰出生于法国 里尔,读过
  • 纹理滤波在计算机图形学中,纹理滤波(Texture filtering)是一种针对一个使用材质贴图的像素,使用临近的一个或多个纹素计算其纹理颜色的方法。从数学上来说,纹理滤波是抗锯齿的一种,但它更
  • 许智藏许智藏,隋朝人物,高阳郡北新城县(今河北省保定市徐水区西)人。许智藏祖父许道幼,曾经因为母亲患病,于是阅读医书,因而深入研究,世称名医。告诫他的儿子们:“为人子者,替父母尝视膳食医
  • 朗尼·拉希德·林恩朗尼·拉希德·林恩(英语:Lonnie Rashid Lynn,1972年3月13日-),艺名凡夫俗子(英语:Common),是一名美国嘻哈男歌手和演员。他于1992年推出首张专辑《Can I Borrow a Dollar?》,并凭着199
  • 金子弌大金子弌大(日语:金子弌大/かねこ ちひろ ;1983年11月8日-)是日本新潟县三条市出身的职业棒球选手,司职投手,效力于日本职棒北海道日本火腿斗士,改名前的名字为金子千寻(日语:金子千尋/か
  • ATI Switchable GraphicsATi Switchable Graphics技术是一项可将ATi独立显卡与Intel集成显卡共享PCI-E 2.0 16X总线,通过驱动程序实时控制独显与集显工作状态以及PCI-E总线占用分配,以此实现的独显与
  • 张美翊张美翊,1856年-1924年,号让三、骞叟,浙江宁波人。清朝末年学者、古文家。人称“浙江三杰”之一。曾二度出任南洋公学(交通大学前身)提调兼总理。早年为弘一法师的学生。子为民国大
  • 卢克·加布特卢克·加布特(英语:Luke Garbutt,1993年5月21日-)是英格兰的一位足球运动员,在场上司职左后卫。他现在属于英甲球队布莱克浦,曾被分别外借至切