大型语言模型

✍ dations ◷ 2025-01-11 22:52:45 #大型语言模型

大语言模型 (英语:large language model,LLM) 是一种语言模型,由具有许多参数(通常数十亿个权重或更多)的人工神经网络组成,使用自监督学习或半监督学习对大量未标记文本进行训练。大型语言模型在2018年左右出现,并在各种任务中表现出色。

尽管这个术语没有正式的定义,但它通常指的是参数数量在数十亿或更多数量级的深度学习模型。大型语言模型是通用的模型,在广泛的任务中表现出色,而不是针对一项特定任务(例如情感分析、命名实体识别或数学推理)进行训练。

尽管在预测句子中的下一个单词等简单任务上接受过训练,但发现具有足够训练和参数计数的神经语言模型可以捕获人类语言的大部分句法和语义。 此外大型语言模型展示了相当多的关于世界的常识,并且能够在训练期间“记住”大量事实。



相关

  • 新晃侗族自治县新晃侗族自治县位于湖南西南边缘、怀化市西南部,为怀化市辖自治县。辖域面积1,511平方公里;国内生产总值99,248万元(2004年);总人口为258,165人(2004),其中非农业人口33833人;侗族占
  • 方宾方宾(14世纪-1421年),江浙行省杭州路钱塘县(今浙江省杭州市)人,明朝政治人物。洪武年间,其以太学生试兵部郎中。建文年间,在应天府从事,后连坐戍守广东。后因茹常举荐恢复官职。朱棣攻
  • 应天巡抚应天巡抚,又称南直巡抚、苏松巡抚,全称总理粮储提督军务兼巡抚应天等府,为中国明朝的一个巡抚职位,驻南直隶苏州府(今中华人民共和国江苏省苏州市)。
  • 顾况顾况(约725年-约814年),字逋翁,号华阳真逸(一作华阳真隐),晚年自号悲翁,苏州海盐县恒山人(今在浙江省海宁市境内),唐代官员、诗人。约开元十五年(727年)前后出生,唐肃宗至德二年(757年)进士,曾
  • 关兴亚关兴亚(1932年2月7日-),辽宁沈阳人,石油化工专家,中国工程院院士,中国石化集团公司上海石油化工研究院高级工程师。
  • 敖德萨大学敖德萨国立大学,全名敖德萨梅契尼可夫国立大学(乌克兰语:Одеський національний університет імені І. І. Мечникова;俄语:Од
  • 横带扁颌针鱼横带扁颌针鱼(学名:),又称扁鹤鱵,俗名鲎鱼、青旗、学仔、白天青旗,为辐鳍鱼纲鹤鱵目鹤鱵亚目鹤鱵科的其中一种。本鱼分布于全世界的热带与温带的水域。包括:水深0至3米(0.0至9.8英尺)。本鱼体甚侧扁,略成带状,截面圆楔型,体高为体宽的2至3倍;两颚突出如长喙,具带状排列之细齿,且具一行稀疏排列之大犬齿;锄骨无齿;头背部平扁,头盖骨背侧之中央沟发育不良;主上腭骨之下缘于嘴角处完全被眼前骨所覆盖;尾柄侧扁,其高远小于其宽,无侧隆起棱;背鳍1枚,与臀鳍对在于体之后方,臀鳍鳍条数多于背鳍,背鳍据23至25枚软条
  • 波士顿南站波士顿南站(英语:South Station,IATA代码:ZTO),位于波士顿市大西洋大道(Atlantic Avenue)和夏街(Summer Street)交汇处的杜威广场(英语:Dewey Square)。是大波士顿地区最大的火车站、长途汽车站和交通枢纽。南站的设施包括:南站汽车站是沿着大西洋大道在火车月台之上的另一栋大楼,设有几个汽车公司和终点站:波士顿南站(英语:South Station或South Station Under)地下设有换乘的地铁站,位于夏街和大西洋大道路口,属于马萨诸塞湾交
  • 古在由秀古在由秀(1928年4月1日-2018年2月5日)是一位日本天文学家,也是东京大学名誉教授、国立天文台名誉教授、综合研究大学院大学名誉教授、群马县立群马天文台名誉台长、日本科学院院士、文化功劳者。古在由秀曾任东京大学东京天文台教授、东京大学东京天文台台长(第12代)、国立天文台台长(第1代)、国际天文学联合会会长、群马县立群马天文台台长。1979年,小行星3040以古在由秀来命名。1963年,他成为东京大学附属东京天文台的助理教授,同年获得朝日奖。1965年,他成为附属于东京天文台国内人造卫星计算设施主任
  • 阿克巴上将盖尔·阿克巴上将(Gial Admiral Ackbar)是科幻电影《星球大战》系列的角色,最初登场的作品是在1983年电影《绝地归来》中。他在剧情里是对抗银河帝国的义军同盟里头一分子;并担任义军战斗舰队的指挥官。虽然阿克巴上将在《星球大战》本传电影首次的登场是在《绝地归来》中,但早在《绝地归来》上映前刊登在美国当地报纸上的《星球大战》相关漫画便已提到他的存在。背景设定上阿克巴是出生于名为达克(Planet Dac)、一颗表面佈满水的星球,他的种族隶属蒙·克莱梅利族(Mon Calamari),外观上是大