生成模型

✍ dations ◷ 2025-11-30 03:08:43 #生成模型

在概率统计理论中, 生成模型是指能够随机生成观测数据的模型,尤其是在给定某些隐含参数的条件下。它给观测值和标注数据序列指定一个联合概率分布。在机器学习中,生成模型可以用来直接对数据建模(例如根据某个变量的概率密度函数进行数据采样),也可以用来建立变量间的条件概率分布。条件概率分布可以由生成模型根据贝叶斯定理形成。

香农 (1948) 给出了有一个英语双词频率表生成句子的例子。可以生成如“representing and speedily is an good”这种句子。一开始并不能生成正确的英文句子,但随着词频表由双词扩大为三词甚至多词,生成的句子也就慢慢的成型了。

生成模型的定义与判别模型相对应:生成模型是所有变量的全概率模型,而判别模型是在给定观测变量值前提下目标变量条件概率模型。因此生成模型能够用于模拟(即)模型中任意变量的分布情况,而判别模型只能根据观测变量得到目标变量的采样。判别模型不对观测变量的分布建模,因此它不能够表达观测变量与目标变量之间更复杂的关系。因此,生成模型更适用于无监督的任务,如分类和聚类。

典型的生成模型包括:

如果观测数据是由生成模型中采样的,那么最大化数据似然概率是一个常见的方法。但是,大部分统计模型只是近似于分布,如果任务的目标是在已知一部分变量的值的条件下,对另一部分变量的推断,那么可以认为这种模型近似造成了一些对于当前任务来说不必要的假设。在这种情况下,使用判别模型对条件概率函数建模可能更准确,尽管具体的应用细节会最终决定哪种方法更为适用。

相关

  • 花镜《花镜》是清代园艺学家陈淏子于1688年(康熙二十七年)写成的一部园艺学著作。全书共3部分,6卷。
  • 东山纪之东山纪之(1966年9月30日-),日本男歌手、男演员,出生于神奈川县川崎市幸区。1979年5月加入杰尼斯事务所,1982年与锦织一清和植草克秀组成少年队开始投入演出并于1985年12月12日以单
  • 筑波市筑波市(日语:つくば市/つくばし Tsukuba shi */?)是位于日本茨城县南部的都市,以坐落于此的筑波科学城(筑波研究学园都市)为人熟知,集中了筑波大学、产业技术综合研究所(日语:産業技
  • 光照治疗光照治疗或光线治疗(英语:Light Therapy 或 Phototherapy)指的是日光或是以特定波长的光(例如:激光光)为光源来做治疗,本篇主要介绍以紫外线(UV)为光源的治疗方式。所谓UV是指光波长
  • 稻草人 (电影)《稻草人》(英语:Strawman)是一部于1987年上映的台湾电影,由王童担任执导。此电影的主要内容以描述日治时期台湾农村人民生活作为背景,细腻描述台湾人遭遇,是“台湾近代三部曲”之
  • 莫斯科及全俄罗斯牧首莫斯科及全俄罗斯牧首(俄语:Патриарх Московский и всея Руси)是俄罗斯正教会主教长、莫斯科都主教的正式名称。其尊称为“圣座”。该牧首职位建于
  • 比尔·斯卡斯加德比尔·伊斯凡·冈瑟·史柯斯嘉(英语:Bill Istvan Günther Skarsgård,1990年8月9日-)是一位瑞典男演员。他著名作品有Netflix原创剧集《铁杉树丛》,以及在改编自斯蒂芬·金同名小
  • .sa.sa为沙特阿拉伯国家和地区顶级域(ccTLD)的域名。A .ac .ad .ae .af .ag .ai .al .am .ao .aq .ar .as .at .au .aw .ax .az  B .ba .bb .bd .be .bf .bg .bh .bi .bj .bm
  • 字 (群论)在群论中,字是群的任何元素和它们的逆元写成的乘积。例如,如果 , 和 是群 的元素,则 , -1 和 -1-1-1 都是集合 {, , } 形成的字。字在自由群和展示理论中扮演重要角色,并是
  • 地杆菌属地杆菌属(学名:)为放线菌目间孢囊菌科的一属革兰氏阳性菌。此属的模式种为肿大地杆菌()。