生成模型

✍ dations ◷ 2025-11-26 01:01:10 #生成模型

在概率统计理论中, 生成模型是指能够随机生成观测数据的模型,尤其是在给定某些隐含参数的条件下。它给观测值和标注数据序列指定一个联合概率分布。在机器学习中,生成模型可以用来直接对数据建模(例如根据某个变量的概率密度函数进行数据采样),也可以用来建立变量间的条件概率分布。条件概率分布可以由生成模型根据贝叶斯定理形成。

香农 (1948) 给出了有一个英语双词频率表生成句子的例子。可以生成如“representing and speedily is an good”这种句子。一开始并不能生成正确的英文句子,但随着词频表由双词扩大为三词甚至多词,生成的句子也就慢慢的成型了。

生成模型的定义与判别模型相对应:生成模型是所有变量的全概率模型,而判别模型是在给定观测变量值前提下目标变量条件概率模型。因此生成模型能够用于模拟(即)模型中任意变量的分布情况,而判别模型只能根据观测变量得到目标变量的采样。判别模型不对观测变量的分布建模,因此它不能够表达观测变量与目标变量之间更复杂的关系。因此,生成模型更适用于无监督的任务,如分类和聚类。

典型的生成模型包括:

如果观测数据是由生成模型中采样的,那么最大化数据似然概率是一个常见的方法。但是,大部分统计模型只是近似于分布,如果任务的目标是在已知一部分变量的值的条件下,对另一部分变量的推断,那么可以认为这种模型近似造成了一些对于当前任务来说不必要的假设。在这种情况下,使用判别模型对条件概率函数建模可能更准确,尽管具体的应用细节会最终决定哪种方法更为适用。

相关

  • 软颚化齿龈边音软颚化齿龈边音是辅音的一种。它与普通的齿龈边音一样,为浊辅音。X-SAMPA音标的符号为l。软颚化齿龈边音是齿龈边音在某些语言中的一个音位变体。因此,其国际音标符号也是由相
  • 微丝微丝(microfilament)是由肌动蛋白(Actin)组成的直径约为7nm的纤维结构。肌动蛋白单体(全称为“球状肌动蛋白”,简称“G肌动蛋白”)表面上有一个ATP结合位点。肌动蛋白单体可一个接
  • 操作子操纵组(英语:operon,又称操纵子或操纵元)是一组关键的核苷酸序列,包括了一个操纵基因(operator),及一个或以上的结构基因被用作生产信使RNA(mRNA)的基元,受一个单一的启动子控制之下。
  • 四果汤四果汤是福建传统甜品,属刨冰的一种,将冰块刨成细细的颗粒,然后佐与空心莲子、银耳、绿豆、薏米、啊达籽(闽南语)、石花、仙草。食用时可以放糖水或蜂蜜。
  • 埃达·洛夫莱斯洛夫莱斯伯爵夫人奥古斯塔·埃达·金·诺尔(Augusta Ada King-Noel, Countess of Lovelace,1815年12月10日-1852年11月27日),原姓拜伦(Byron),是一位英国数学家兼作家,代表作是她为查
  • 青玉案青玉案,词牌名,别称《横塘路》、《西湖路》。双调六十七字,前后阕各五仄韵,上去通押。平平仄仄平平仄,仄仄仄平平仄( 上三下三 )。仄仄平平平仄仄。仄平平仄,仄平平仄,仄仄平平仄。平
  • 圣拉维达斯那加尔县圣拉维达斯那加尔县是印度的一个县,位于该国北部,由北方邦负责管辖,面积1,055平方公里,识字率为89.14%,2011年人口1,554,203,人口密度每平方公里1,473人。坐标:25°20′24″N 82°2
  • 桓晔桓晔,字文林,沛郡龙亢人,本名桓严,东汉名士。议郎桓鸾之子。桓晔自少已经重视修养志节。他的姑母是司空杨赐(杨震之孙、杨彪之父)的夫人,在桓晔父亲桓鸾逝世的时候,姑母回娘家赴丧,却
  • 远藤纯远藤纯(2000年5月24日-),日本足球运动员,日本国家女子足球队成员。2019年,她共为日本国家女子足球队出场9次。她曾代表国家参加2019年世界杯女子足球赛。
  • 数码迷彩数码迷彩(英语:Digital camouflage)是一种融合了微观和宏观模式的,运用电脑辅助设计而成的新式迷彩,常常由像素样的方点组成。从分形原理上说,这种迷彩提供多种观察尺度(相应地,多种距离)下的伪装。在红外探测和夜视镜下,数码迷彩因其复杂的设计,在隐蔽上比传统的迷彩具有更大的优势。数码迷彩并非全为像素构成;像素化本身也并不一定能提供优势。美国西点军校的教授Timothy R. O'Neill中校是最早注意到此迷彩效果的人。20世纪70年代,美国陆军曾研究过数码迷彩,但没有重视。1978年到80年