生成模型

✍ dations ◷ 2025-04-02 18:47:15 #生成模型

在概率统计理论中, 生成模型是指能够随机生成观测数据的模型,尤其是在给定某些隐含参数的条件下。它给观测值和标注数据序列指定一个联合概率分布。在机器学习中,生成模型可以用来直接对数据建模(例如根据某个变量的概率密度函数进行数据采样),也可以用来建立变量间的条件概率分布。条件概率分布可以由生成模型根据贝叶斯定理形成。

香农 (1948) 给出了有一个英语双词频率表生成句子的例子。可以生成如“representing and speedily is an good”这种句子。一开始并不能生成正确的英文句子,但随着词频表由双词扩大为三词甚至多词,生成的句子也就慢慢的成型了。

生成模型的定义与判别模型相对应:生成模型是所有变量的全概率模型,而判别模型是在给定观测变量值前提下目标变量条件概率模型。因此生成模型能够用于模拟(即)模型中任意变量的分布情况,而判别模型只能根据观测变量得到目标变量的采样。判别模型不对观测变量的分布建模,因此它不能够表达观测变量与目标变量之间更复杂的关系。因此,生成模型更适用于无监督的任务,如分类和聚类。

典型的生成模型包括:

如果观测数据是由生成模型中采样的,那么最大化数据似然概率是一个常见的方法。但是,大部分统计模型只是近似于分布,如果任务的目标是在已知一部分变量的值的条件下,对另一部分变量的推断,那么可以认为这种模型近似造成了一些对于当前任务来说不必要的假设。在这种情况下,使用判别模型对条件概率函数建模可能更准确,尽管具体的应用细节会最终决定哪种方法更为适用。

相关

  • 弱碱布朗斯特-劳里酸碱理论中,弱碱指在水溶液中不完全电离的碱,意即质子化反应不完全。一般碱的pH值范围为7~14,其中7为中性,14则为强碱性,可通过以下公式计算:相对强碱而言,弱碱从水分
  • 娱乐性用药娱乐性用药(英语:Recreational drug use),意指会影响人类中枢神经系统,改变人类意识、情绪状态的精神药物统称。这类药物通常被用来产生欣快感(euphoria)、阻止不快记忆、增加愉悦
  • 现代进化综论现代生物分类群体从它们的 共同祖先遗传分化的图示。进化论介绍(英语:Introduction to evolution) 进化的证据 共同起源 共同起源的证据群体遗传学 · 遗传多样性 突变 · 自
  • 数理金融学金融数学(英语:Financial Mathematics)又称计量金融学(英语:Quantitative Finance)、数学金融学(英语:Mathematical Finance),是专为金融市场而设的应用数学。其本义上与金融经济学的
  • 地球日日,一般指地球日,是时间单位。“日”有时指每周的星期日。口语中,“日”或者“天”有时也可能特指白昼,即不包括夜晚之半日时间。除了一日24小时(86,400秒)之外,基于地球绕其自转轴
  • 哈康七世哈康七世(Haakon VII av Norge, Christian Frederik Carl Georg Valdemar Axel,1872年8月3日-1957年9月21日)是挪威从瑞典独立后的第一任挪威国王,丹麦国王弗雷德里克八世与皇后
  • KOA corporationKOA公司(コーア株式会社, KOA株式会社)是一家成立于1940年在东京一家日本电子被动元件供应商,总部设在长野县伊那。KOA是世界上最大的贴片电阻制造商之一。产品范围涵盖了低温共
  • 小科尼·齐利亚克斯小科尼·齐利亚克斯(英语:Konni Zilliacus 1894年9月13日-1967年7月6日)英国工党左翼政治家,工党独立小组成员,生于日本神户,芬兰和美国血统,父亲为芬兰政治家老科尼·齐利亚克斯,小
  • SPACE SHOWER电视台SPACE SHOWER电视台(SPACE SHOWER TV)是由SPACE SHOWER网络公司运营的音乐频道。该公司的总部位于东京。 该频道于1989年12月1日6:00开播。简称SSTV、スペシャ。建立的想法是
  • 沃思县 (佐治亚州)沃思县(英语:Worth County)是美国乔治亚州南部的一个县。面积1,488平方公里。根据美国2000年人口普查,共有人口21,967人。县治西尔维斯特(Sylvester)