大型语言模型

✍ dations ◷ 2025-06-20 21:57:40 #大型语言模型

大语言模型 (英语:large language model,LLM) 是一种语言模型,由具有许多参数(通常数十亿个权重或更多)的人工神经网络组成,使用自监督学习或半监督学习对大量未标记文本进行训练。大型语言模型在2018年左右出现,并在各种任务中表现出色。

尽管这个术语没有正式的定义,但它通常指的是参数数量在数十亿或更多数量级的深度学习模型。大型语言模型是通用的模型,在广泛的任务中表现出色,而不是针对一项特定任务(例如情感分析、命名实体识别或数学推理)进行训练。

尽管在预测句子中的下一个单词等简单任务上接受过训练,但发现具有足够训练和参数计数的神经语言模型可以捕获人类语言的大部分句法和语义。 此外大型语言模型展示了相当多的关于世界的常识,并且能够在训练期间“记住”大量事实。



相关

  • 初潮初潮(英语:menarche),又称为初经,是指第一次月经。代表少女的身体经历青春期的变化。初潮通常在胸部开始发育后一两年出现。初潮代表子宫内膜受到雌激素刺激而发育了,也代表从子宫
  • 约阿希姆·高克约阿希姆·高克(德语:Joachim Gauck,1940年1月24日-),曾任德意志联邦共和国第11任总统,前路德派牧师,是德国首位无党籍总统。约阿希姆·高克于1940年1月24日在大德意志帝国罗斯托克
  • 脱氧腺苷三磷酸去氧腺苷三磷酸(Deoxyadenosine triphosphate,dATP)是一种去氧核苷酸三磷酸(dNTP),结构与腺苷三磷酸(ATP)相似,但少了一个位于五碳糖2号碳上的-OH基,取而代之的是单独的氢原子。若移去
  • 莫顿·费尔德曼莫顿·费尔德曼 (英语:Morton Feldman, 1926年1月12日 - 1987年9月3日) 是一位美国作曲家。费尔德曼是20世纪音乐的一位重要人物,他与约翰·凯奇、克里斯蒂安·沃尔夫(英语:Chri
  • 华兰生物华兰生物工程股份有限公司是一家位于河南新乡从事血液制品研发和生产的制药公司,2004年6月登陆深圳证券交易所中小板(代码:002007)。前身为成立于1992年的华兰生物工程有限公司,1
  • 萨曼莎·乔萨曼莎·乔(英语:Samantha Jo,1991年3月29日-),是一位加拿大女演员和武术运动员。母亲是柔道黑带,因深受家庭影响,于4岁开始学习柔术,12岁转而学习中国武术与太极拳。2007年参加北京
  • 宗室崇文崇文(1813年7月26日-1844年9月15日),字心澜,号杏田,镶蓝旗宗室。嘉庆十八年癸酉六月廿九日丑时生,嫡母伊尔根觉罗氏道富僧阿之女。道光十一年辛卯科文举人,十三年癸巳恩科中式文进士
  • 监管之人谁监管?'Quis custodiet ipsos custodes?'是一句拉丁文谚语,通常被认为出自古罗马诗人尤维纳利斯的讽刺作品《Satire VI》段落 347章8节,直译作“谁来监督监督者?”或“谁来把守守卫者?”,通译作“监管之人谁监管?” 。在现代的用法中,它的出现经常伴随有柏拉图政治哲学或者政治腐败等的问题,但是现在没有已知连接到柏拉图或者政治理论的原始来源。这句话通常是以拉丁语来引述,原文来自1至2世纪罗马讽刺作家尤维纳利斯的讽刺诗集(英语:Satires of Juvenal)。然而,这句话具
  • 乔恩·布罗克曼乔纳森·罗德尼·布罗克曼(英语:Jonathan Rodney Brockman,1987年3月20日-),美国NBA联盟职业篮球运动员。他在2009年的NBA选秀中第2轮第38顺位被波特兰开拓者选中。
  • 米尔扎·巴希鲁丁·马末·阿末米尔扎·巴希鲁丁·马末·阿末 (乌尔都语:مرزا بشیر الدین محمود احمد‬‎‎) (1889年1月12日 – 1965年11月7日),简称马末·阿末,是伊斯兰教阿赫迈底亚教派的第二个哈里发。(阿拉伯语:خليفة المسيح الثاني‎, )阿赫迈底亚创始人米尔扎·古拉姆·艾哈迈德和他的第二任妻子努沙特·贾汗别姬的儿子。1914年3月14日,也就是他的前任——年仅25岁的哈金·努丁去世的第二天,他当选为米尔扎·古拉姆·艾哈迈德的第二任继承人。马末·阿末当选为第二任哈里发后,运动