大型语言模型

✍ dations ◷ 2025-11-06 03:03:59 #大型语言模型

大语言模型 (英语:large language model,LLM) 是一种语言模型,由具有许多参数(通常数十亿个权重或更多)的人工神经网络组成,使用自监督学习或半监督学习对大量未标记文本进行训练。大型语言模型在2018年左右出现,并在各种任务中表现出色。

尽管这个术语没有正式的定义,但它通常指的是参数数量在数十亿或更多数量级的深度学习模型。大型语言模型是通用的模型,在广泛的任务中表现出色,而不是针对一项特定任务(例如情感分析、命名实体识别或数学推理)进行训练。

尽管在预测句子中的下一个单词等简单任务上接受过训练,但发现具有足够训练和参数计数的神经语言模型可以捕获人类语言的大部分句法和语义。 此外大型语言模型展示了相当多的关于世界的常识,并且能够在训练期间“记住”大量事实。



相关

  • 学院哥特式学院哥特式建筑(Collegiate Gothic)是哥特复兴式建筑的一种,吸取了英格兰的都铎式建筑和哥特式建筑的特色。它在19世纪末至20世纪初流行于美国和加拿大的大学和学院中,因而得名
  • 台湾优视媒体科技台湾优视媒体科技股份有限公司(英语:Taiwan Win TV Media CO., Ltd.,简称:MOMOTV),是属于富邦集团所经营的数字电视,于2010年9月15日成立,2011年7月12日开始试播。成立初期由富邦金
  • 中心点 (阿拉巴马州)中心点(英语:Center Point),是美国阿拉巴马州下属的一座城市。面积约为6.12平方英里(约合 15.84平方公里)。根据2010年美国人口普查,该市有人口16,921人,人口密度为2,766.68/平方英
  • 陈宏谋《沧浪亭五百名贤像》之陈宏谋石刻像陈宏谋(1696年-1771年),原名弘谋,后避讳乾隆帝,改名宏谋,字汝咨,号榕门,广西临桂县(今桂林市)人,清朝政治人物。雍正元年(1723年)癸卯恩科第一名举人(解
  • 玛丽·伯恩海姆玛丽·伯恩海姆(英语:Mary Bernheim 娘家姓为Hare 1902年-1997年)是一位英国生物化学家,在剑桥大学获得博士学位。当她还是研究生时,就发现了一种酶并命名为酪胺氧化酶(后来改为单
  • 升庵诗话《升庵诗话》,明朝杨慎撰,有八卷及十二卷本。升庵诗话刻入《升庵文集》,共八卷,刻入《升庵外集》,共十二卷,刻入《丹铅总录》,共四卷。1983年中华书局出版《历代诗话续编》本。
  • 龚丽正《东轩吟社画像》之龚丽正像,清·汪曾唯刊,费丹旭绘龚丽正(1767年-1841年),字至极,一字旸谷,又字赐泉,号学路,又号暗斋,浙江仁和(今杭州)人,清朝政治人物,进士出身。清朝文学家龚自珍之父,乾
  • 2006年大西洋飓风季罗</noinclude>2006年大西洋飓风季于2006年6月1日正式开始,同年11月30日结束,传统上这样的日期界定了一年中绝大多数热带气旋在大西洋盆地形成的时间段。本季的活跃程度与前一
  • 22号研究所22号研究所成立于1978年,由苏联科学院和国防部共同创立。它的任务是调查发现于苏联境内的不明飞行物事件。 22号研究所是一个秘密组织,存在了长达13年之久(直到苏联解体),该机