基于转换器的生成式预训练模型

✍ dations ◷ 2025-02-27 17:13:56 #基于转换器的生成式预训练模型

基于转换器的生成式预训练模型(Generative pre-trained transformers, GPT)是一种延伸自转换器架构(Transformer)的自然语言生成模型。它可以进行微调以完成各种自然语言处理任务,例如文本生成、代码生成、视频生成、文本问答、图像生成、论文写作、影视创作、科学实验设计等。基于大量语料数据上训练,以生成类似于人类自然语言的文本。其名称中的“预训练”指的是在大型文本语料库上进行的初始训练过程,其中模型学习预测文章中下一个单词,这为模型在具有限量的任务特定数据的下游任务中表现良好提供了坚实的基础。

2018年6月11日,OpenAI发表了一篇名为《通过生成式预训练提高语言理解能力》(Improving Language Understanding by Generative Pre-Training)的论文,在其中介绍了“基于转换器的生成式预训练模型”(GPT)。当时,表现最好的自然语言生成模型主要依靠大量手动标注数据的监督学习。这种依赖于人类监督学习的开发途径限制了模型在未经精细标注的数据集上的应用;许多语言(例如斯瓦希里语或海地克里奥尔语)也因缺乏能建立起语料库的文本资料而造成实际应用(如翻译和解释)上的困难;此外,训练超大模型相当耗时且开支非常昂贵。

相比之下,GPT提出了一种“半监督(semi-supervised)”(后来普遍改称为“自监督”)的方法——先在没有标号的数据上面训练一个预训练模型,再在少量标号数据上面训练一个分辨的微调模型。

相关

  • 美墨战争美国胜利美墨战争是美国与墨西哥之间于从1846年至1848年爆发的一场战争。19世纪,美国国内流行“天定命运论”,昭昭天命成为美国19世纪时的政治标语 ,其中一层含义就是美国人是
  • 杓会厌肌杓会厌肌(aryepiglottic muscle、aryepiglotticus)是一种在从杓状软骨到会厌之杓状会厌襞中运行的喉部肌肉。杓会厌肌本条目包含来自属于公共领域版本的《格雷氏解剖学》之内
  • 告示牌《公告牌》(英语:Billboard,形象化为billboard)杂志,是一个美国娱乐杂志和媒体品牌,由埃德里奇工业(英语:Eldridge Industries)旗下的公告牌-好莱坞报道传媒集团(Billboard-Hollywood
  • 秋信守秋信守(朝鲜语:추신수/秋信守、Shin-Soo Choo,1982年7月13日-),在韩国昵称为“辣椒”(因球迷对秋信守欢呼时喊著“Go Choo!”的呼号,音似韩文的辣椒(고추)),出生于韩国的釜山广域市,现为
  • 弥勒市弥勒市是中华人民共和国云南省红河哈尼族彝族自治州北部下属的一个县级市,南盘江流贯。 面积4004平方公里,2002年人口49万人。市政府驻弥阳镇。2019年9月弥勒市荣获全国绿化模
  • 武汉城市圈武汉城市圈,又称“武汉都市圈”、“1+8”城市圈、“大武汉都会圈”,是指以中部地区最大城市武汉为圆心,覆盖黄石、鄂州、黄冈、孝感、咸宁、仙桃、天门、潜江周边8个大中型城市
  • 平谷区长城列表平谷区长城列表旨在列出中国北京市平谷区的长城墙体及附属设施。
  • 义西请马至山义西请马至山,位于台湾南投县信义乡双龙村、东埔村与花莲县卓溪乡仑山村之间,,为台湾百岳之一,排名第67。义西请马至山海拔3,245米,属于中央山脉。义西请马至山也是中央山脉棱脊,
  • 阿黑麻 (叶尔羌汗国)阿黑麻(Muhammed II,?-1619年),叶尔羌汗国第五任君主,拉失德的第五个儿子马黑麻长子。1610年,马黑麻死后,黑山派沙迪和卓拥立他为主。这引起了吐鲁番总督阿都剌因的不满,他在东部自立为汗,同时哈斯木王子在焉耆叛乱。阿黑麻的长子帖木儿平定了哈斯木,但阿都剌因依然割据东部。1615年,帖木儿去世,阿黑麻的堂弟沙拉夫丁王子在喀什噶尔叛乱,阿黑麻派幼子阿布杜拉提甫平叛。1619年,阿黑在打猎时被反对派沙家族暗杀,沙家族拥立其堂弟忽来失速檀为汗即位。
  • 灯光如来灯光如来又作锭光如来、定光如来,定光,音译提和竭罗、提洹竭。于《过去现在因果经》卷一记载,此佛初生之日,四方皆明,日月火珠复不为用。以有此奇特,故名为普光。胜鬘夫人当来正觉之佛号。胜鬘经曰:“过二万阿僧祇劫当得作佛,号普光如来。”。《贤愚经》卷三〈贫女难陀品〉所载:过去久远二阿僧祇九十一劫,阎浮提有大国王,名波塞奇。王有太子名勒那识只(即宝髻),出家学道而成佛。时比丘阿梨蜜罗日日燃灯供养彼佛,佛乃为比丘授记,告知当来成佛,名定光如来。 据增一阿含经卷十三所载,过去久远劫有王名为地主,将统领之阎浮里地半分予