生成模型

✍ dations ◷ 2025-11-26 23:02:44 #生成模型

在概率统计理论中, 生成模型是指能够随机生成观测数据的模型,尤其是在给定某些隐含参数的条件下。它给观测值和标注数据序列指定一个联合概率分布。在机器学习中,生成模型可以用来直接对数据建模(例如根据某个变量的概率密度函数进行数据采样),也可以用来建立变量间的条件概率分布。条件概率分布可以由生成模型根据贝叶斯定理形成。

香农 (1948) 给出了有一个英语双词频率表生成句子的例子。可以生成如“representing and speedily is an good”这种句子。一开始并不能生成正确的英文句子,但随着词频表由双词扩大为三词甚至多词,生成的句子也就慢慢的成型了。

生成模型的定义与判别模型相对应:生成模型是所有变量的全概率模型,而判别模型是在给定观测变量值前提下目标变量条件概率模型。因此生成模型能够用于模拟(即)模型中任意变量的分布情况,而判别模型只能根据观测变量得到目标变量的采样。判别模型不对观测变量的分布建模,因此它不能够表达观测变量与目标变量之间更复杂的关系。因此,生成模型更适用于无监督的任务,如分类和聚类。

典型的生成模型包括:

如果观测数据是由生成模型中采样的,那么最大化数据似然概率是一个常见的方法。但是,大部分统计模型只是近似于分布,如果任务的目标是在已知一部分变量的值的条件下,对另一部分变量的推断,那么可以认为这种模型近似造成了一些对于当前任务来说不必要的假设。在这种情况下,使用判别模型对条件概率函数建模可能更准确,尽管具体的应用细节会最终决定哪种方法更为适用。

相关

  • 法属波利尼西亚法属波利尼西亚(法语:Polynésie française,塔希提语:Pōrīnetia Farāni)是法国在南太平洋的海外集体和自治国,由几组波利尼西亚群岛组成,包括:马克萨斯群岛(即侯爵夫人群岛)、社会
  • 病假病假 (或称有薪病假)是劳工能因身体健康因素,留在家里休养,并且不会失去工资。带薪病假在许多国家是法定要求,像是大部分欧洲国家、许多拉美国家,还有一些非洲和亚洲国家在法规
  • 科学革命的结构《科学革命的结构》(The Structure of Scientific Revolutions),1962年出版;于1970年再版;英文简写为SSR),是美国科学史家与科学哲学家托马斯·库恩的著作。这本书的出版是历史,哲
  • 派姆单抗帕博利珠单抗(Pembrolizumab,商品名Keytruda,中文商品名为可瑞达、吉舒达)是用于癌症免疫疗法的人源化PD-1单克隆抗体。FDA批准该药用于治疗黑色素瘤、肺癌、头颈癌、霍奇金淋巴
  • 第29届金马奖第29届金马奖,由中华民国官方举办的华语电影评选活动,为1992年台湾与华语电影业界的年度盛事之一,于台北市国父纪念馆举行颁奖典礼。本届由《无言的山丘》获得最佳剧情片奖。颁
  • 隐睾隐睾(英语:Cryptorchidism)指男性睾丸未下降至阴囊,包括睾丸下降不全和睾丸异位。这个词来自希腊语κρυπτός,kryptos,意思是隐藏的,和ὄρχις,orchis,意思是睾丸。它是男性
  • FIRFIR或fir可以指:
  • 陈嘉琦陈嘉琦(1985年9月25日-),汉族,中国歌手、演员,2005年获得湖南卫视《超级女声》广州赛区第5名,全国25强,“2005年度超级女声终极PK”终极人气十强、“2005年超级女声五大美女”而出道
  • 亨泽尔引理亨泽尔引理是数学中模算术的一个结论。亨泽尔引理说明,如果一个模.mw-parser-output .serif{font-family:Times,serif}p(p是给定的质数)的多项式方程有一个单根,则可以通过这个
  • 大专校院103学年度足球运动联赛大专校院103学年度足球运动联赛为第10届大专校院足球运动联赛。男子组分为公开组男生第一级、公开组男生第二级和一般男生组,女子组分为公开组女生第一级。本年度公开组男生第一级第七名、第八名将降级到来年公开组男生第二级。公开组男生第二级冠军、亚军将升级到来年公开组男生第一级。一般男生组前四名将来年公开组男生第二级。参赛大专校院102学年度足球运动联赛公开组男生第一级比赛前六名学校︰北市大学、辅仁大学、铭传大学、屏东教大(现改为屏东大学)、台湾体大、清华大学及公开组男生第二级比赛前两名学校︰台北科大、昆山科大优