生成模型

✍ dations ◷ 2025-02-24 14:34:14 #生成模型

在概率统计理论中, 生成模型是指能够随机生成观测数据的模型,尤其是在给定某些隐含参数的条件下。它给观测值和标注数据序列指定一个联合概率分布。在机器学习中,生成模型可以用来直接对数据建模(例如根据某个变量的概率密度函数进行数据采样),也可以用来建立变量间的条件概率分布。条件概率分布可以由生成模型根据贝叶斯定理形成。

香农 (1948) 给出了有一个英语双词频率表生成句子的例子。可以生成如“representing and speedily is an good”这种句子。一开始并不能生成正确的英文句子,但随着词频表由双词扩大为三词甚至多词,生成的句子也就慢慢的成型了。

生成模型的定义与判别模型相对应:生成模型是所有变量的全概率模型,而判别模型是在给定观测变量值前提下目标变量条件概率模型。因此生成模型能够用于模拟(即)模型中任意变量的分布情况,而判别模型只能根据观测变量得到目标变量的采样。判别模型不对观测变量的分布建模,因此它不能够表达观测变量与目标变量之间更复杂的关系。因此,生成模型更适用于无监督的任务,如分类和聚类。

典型的生成模型包括:

如果观测数据是由生成模型中采样的,那么最大化数据似然概率是一个常见的方法。但是,大部分统计模型只是近似于分布,如果任务的目标是在已知一部分变量的值的条件下,对另一部分变量的推断,那么可以认为这种模型近似造成了一些对于当前任务来说不必要的假设。在这种情况下,使用判别模型对条件概率函数建模可能更准确,尽管具体的应用细节会最终决定哪种方法更为适用。

相关

  • 中华女子学院中华女子学院是位于中国北京市的一所女子大学,隶属于中华全国妇女联合会(妇联)。前身是1949年由宋庆龄、何香凝、蔡畅等人创办的新中国女子职业学校,后来作为妇联的干部学校。19
  • 克维莫-卡特利州ქვემო ქართლის მხარე Kvemo Kartlis mkhare克维莫-卡特利州 (ქვემო ქართლის მხარე,意思是下卡特利)是格鲁吉亚的一个州,位于该国东南部地区
  • 爱德华·策勒爱德华·戈特洛布·策勒(Eduard Gottlob Zeller,1814年1月22日生于穆尔河畔施泰因海姆 ,1908年3月19日逝于斯图加特),德国哲学家、图宾根神学院新教神学家。策勒以古希腊哲学,尤
  • 安吉丽娜·朱莉安吉丽娜·朱莉(又译作安杰利娜·朱莉)(英语:Angelina Jolie,1975年6月4日-),本名安吉丽娜·朱莉·沃特(Angelina Jolie Voight),美国影坛超级巨星、著名女演员、慈善家、社会活动家,美
  • 丹麦国铁EG型电力机车EG型电力机车是德国西门子交通集团为丹麦国家铁路公司设计制造的一种双电流制大功率电力机车,也是“欧洲短跑手”(EuroSprinter)系列电力机车车型之一,适用于供电制式为15千伏16
  • 布拉迪斯拉发1区布拉迪斯拉发1区(Bratislava 1)是斯洛伐克首都布拉迪斯拉发的一个区,范围是布拉迪斯拉发老城(斯洛伐克语:Staré mesto,德语:Pressburg - Altstadt,匈牙利语:Pozsony - Óváros)。布
  • 文峪河文峪河,位于中华人民共和国山西省中部的一条河流,为汾河右岸支流,也是汾河最大的一条支流。源头称庞泉沟,发源于吕梁市交城县西北关帝山主峰孝文山南麓,自西北向东南,流经庞泉沟镇
  • 格拉西亚斯-阿迪奥斯角格拉西亚斯-阿迪奥斯角(西班牙语:Cabo Gracias a Dios)是中美洲东岸中部蚊子海岸的海岬,也是尼加拉瓜北大西洋自治区和洪都拉斯格拉西亚斯-阿迪奥斯省的界河──科科河(Río Coco
  • 奇异球菌属Deinobacter Oyaizu et al. 1987异常球菌属(学名:)为奇异球菌目奇异球菌科的一属革兰氏阳性的球状菌。可能广泛分布于环境中。此属的模式种为耐放射异
  • 申铉彬申铉彬(韩语:신현빈,1986年4月10日-),名字先前被音译为申贤彬,本名郭铉彬(韩语:곽현빈),韩国女演员。