GPT-1

✍ dations ◷ 2024-12-23 09:18:52 #GPT-1

GPT-1,全称基于转换器的生成式预训练模型1(Generative Pre-trained Transformer 1)是继2017年Google推出Transformer架构后,OpenAI推出的第一个大型语言模型。2018年,OpenAI发布了一篇名为《通过生成式预训练提高语言理解能力》(Improving Language Understanding by Generative Pre-Training)的论文,其中介绍了该初期模型以及基于转换器的生成式预训练模型的总体概念 。

在此之前,表现最佳的神经网络自然语言处理模型主要采用依靠大量手动标记数据的监督学习。这种依赖于监督学习的方法限制了它们在未经精细标注的数据集上的应用,并使训练超大模型相当耗时且开支非常昂贵;许多语言(例如斯瓦希里语或海地克里奥尔语)由于缺乏能创建起语料库的文本资料,导致模型难以对其进行翻译和解释。相比之下,GPT采用了“半监督”方法,包含两个阶段:无监督的生成式“预训练”阶段,使用目标函数来设置初始参数;以及有监督的判别式“微调(英语:fine-tuning (machine learning))”阶段,将这些参数在目标任务上进行微调。

与之前基于注意力增强的循环神经网络(RNN)技术相比,GPT采用的Transformer架构为模型提供了比循环机制更加结构化的记忆;使其拥有“跨多样任务的稳健传输性能”。

选择BookCorpus作为训练数据集的一部分原因是其中包含了长篇连续文本,有助于模型学习处理长距离信息。该数据集包含来自各种流派的7,000多本未发表的小说。当时其他可用的数据集虽然更大,但缺乏这种长距离结构(在句子级别上被“洗牌”) 。

研究人与使用库清理BookCorpus文本,以标准化标点和空格,并由进行标记化。

GPT-1采用了十二层的仅解码变换器,使用了12个掩码的自注意力头,每个头有64个维度状态(总共768个维度状态)。GPT-1采用了Adam优化算法(英语:stochastic gradient descent#Adam),而非简单的随机梯度下降(英语:stochastic gradient descent);学习率在前2000次更新中线性增加到最大值2.5×10−4,然后通过余弦调度减少到0。

尽管微调是针对特定任务进行调整的,但其预训练过程并没有调整;为了执行各种任务,只对其底层的与任务无关的模型架构进行了最小的更改。尽管如此,GPT-1仍然在多个语言处理任务中改进了以往的基准,在许多任务上的表现优于面向任务的判别式训练模型。

在自然语言推理(又称文字蕴涵)任务中,GPT-1在QNLI(维基百科条目)和MultiNLI(转录的演讲、流行小说和政府报告等来源)两个数据集上分别比以往最佳结果提升了5.8%和1.5%。该任务评估的是其解释一对句子,并将它们之间的关系分类为“蕴涵”、“矛盾”或“中立”的能力。在与问题回答和常识推理(英语:commonsense reasoning)相关的两个任务上,GPT-1也优于以前的模型,分别在RACE(中学和高中考试题目的数据集)上提升了5.7%,在Story Cloze Test上提升了8.9%。

在语义相似性(又称释义检测)任务方面,GPT-1预测两个句子是否语义对等的能力比以往最佳结果提高了4.2%,该任务使用了Quora问题对(Quora Question Pairs,QQP)数据集。

在使用语言可接受性语料库(Corpus of Linguistic Acceptability,CoLA)进行文本分类任务时,GPT-1获得了45.4分,而以前最好的得分是35.0。在GLUE(一种多任务测试)上,GPT-1获取了72.8的总体得分,优于以前的最好成绩68.9分。


相关

  • 奇卡莫加之役奇卡莫加战役是美国南北战争的重要战役之一,发生于1863年9月19日至20日,标志着北部联邦的奇卡莫加进攻行动的结束。这次战役是联邦在西部战区最重要的胜利,伤亡人数在南北战争
  • 1960年亚足联青年锦标赛1960年亚足联青年锦标赛在马来亚联合邦举行,此次赛事是第二届亚足联U-19锦标赛。参赛的有如下队伍: 日本 v 印尼 马来亚 v 韩国
  • 千里长城千里长城是高句丽和王氏高丽在7世纪和11世纪在辽东和朝鲜半岛北部修建的军事防御工事名称。在高句丽成功抵御隋朝百万大兵的入侵之后,为了防止来自于唐朝的进攻,高句丽631年开
  • 普罗米修斯 (电影)《普罗米修斯》(英语:)是2012年的英国科幻电影,由雷德利·斯科特执导,乔·斯派茨和戴蒙·林道夫编剧,劳米·拉佩斯、迈克尔·法斯宾德、盖·皮尔斯、伊德瑞斯·艾尔巴、罗根·马歇
  • 罗伯特·菲尔默罗伯特·菲尔默(英语:Robert Filmer 约1588年-1653年5月26日)英国政治理论家,主张君权神授说。知名著作《君权论》(Patriarcha)于1680年死后出版,辉格党利用该作品多次反驳包括阿尔
  • 加藤爱加藤爱(本名为加藤爱,艺名为使用假名书写的加藤あい,1982年12月12日-)是日本女演员与模特儿,出生在爱知县西春日井郡新川町(现在的清须市),独生女。2005年3月,从亚细亚大学国际关系学
  • 梁焘梁焘(1034年-1097年),字况之,北宋郓州须城县(今山东省东平县)人。兵部员外郎梁蒨之子,宋哲宗时尚书右丞、尚书左丞。梁焘开始以父任补太庙斋郎,举进士中第。历任编校秘阁书籍、集贤校理,出任通判明州、检详枢密院五房文字。元丰年间,上书论时政,攻击王安石熙宁变法“乖戾”,“天下之民被其害”。于是出知宣州。元丰五年(1082年),宋神宗说:“王中正功赏文书,你为什么独独认为不可以?”梁焘回答说“:王中正欺罔假冒侥幸希图,我不敢委曲法制以辜负陛下。”不久,梁焘为京西路提点刑狱。宋哲宗即位,召用梁焘为工部郎中
  • 约西亚约西亚 (希伯来语:יֹאשִׁיָּהוּ‎;Josiah,前640年-前609年) 是古代中东国家南犹大王国的第十六任君主。他的父亲是亚们,母亲是波斯加(位于犹大的城镇)人耶迪大,外祖父是亚大雅。至少有两位妻子,分别是生下约雅敬的西比黛(Zebidah)以及生下约哈斯和西底家的哈慕塔(Hamutal)。以圣经形容来看,西比黛很有可能是王后。四个儿子中只有长子约哈南生母不详,也没有作王统治犹大。约西亚在位的年期,目前历史上有两种讲法:根据《圣经》,约西亚登基作犹大王的时候年八岁,在耶路撒冷作王三十一年
  • 马克·布伊苏马克·布伊苏(法语:Marc Bouissou,1931年4月6日-2018年11月23日),法国男子赛艇运动员。他曾代表法国参加1952年夏季奥林匹克运动会赛艇比赛,获得男子四人单桨无舵手银牌。
  • 土偶土偶(日语:土偶/どぐう  */?)是人形陶土制品,日本绳文时代的代表性遗物。早期即有发现,多数在中期以后。到了绳文后期,土偶的制作渐少。东日本分布尤其密集,种类很多。一般认为土偶是女性形象。有的说法强调这与生殖和丰盈的生活有关,是宗教、咒术仪式的对象。绳文时代的人们生活逐渐转为定居,建造竖穴住居并进行栽培。从同时代考古发现的大量祭祀遗迹推测,绳文人具有万物皆有灵的宗教观,它们崇拜自然、敬畏自然,有以精灵、自然灵为祭祀对象的仪式,并有可能有初步的亡灵概念>神和女人是土偶重要的形象来源,大部分土偶具有