大型语言模型

✍ dations ◷ 2025-08-21 04:04:12 #大型语言模型

大语言模型 (英语:large language model,LLM) 是一种语言模型,由具有许多参数(通常数十亿个权重或更多)的人工神经网络组成,使用自监督学习或半监督学习对大量未标记文本进行训练。大型语言模型在2018年左右出现,并在各种任务中表现出色。

尽管这个术语没有正式的定义,但它通常指的是参数数量在数十亿或更多数量级的深度学习模型。大型语言模型是通用的模型,在广泛的任务中表现出色,而不是针对一项特定任务(例如情感分析、命名实体识别或数学推理)进行训练。

尽管在预测句子中的下一个单词等简单任务上接受过训练,但发现具有足够训练和参数计数的神经语言模型可以捕获人类语言的大部分句法和语义。 此外大型语言模型展示了相当多的关于世界的常识,并且能够在训练期间“记住”大量事实。



相关

  • 生化需氧量生化需氧量(Biochemical oxygen demand,简写为BOD),是水体中的好氧微生物在一定温度下将水中有机物分解成无机质,这一特定时间内的氧化过程中所需要的溶解氧量。虽然生化需氧量并
  • 永历帝明永历帝朱由榔(1623年11月1日-1662年6月1日),又称“明昭宗”,南明第四位也是最后一位皇帝(1646年12月24日-1662年6月1日在位)。原为“桂王”。1646年,南明隆武帝被俘死,本为桂王的朱
  • 斯洛伐克行政区划斯洛伐克全国分为8个州(kraj),每个州的名称与其首府相同。州下分区(okres),全国共有79个区。
  • 第42届金马奖第42届金马奖,2005年华语电影界的年度盛事之一,表扬2005年度杰出电影与电影工作者。颁奖典礼于2005年11月13日晚间7时于基隆文化中心举行,主持人为胡瓜、侯佩岑。本届周星驰自
  • 滕斯特 (爱达荷州)滕斯特(英语:Tensed)是一个位于美国爱达荷州本瓦县的城市。滕斯特的座标为47°09′37″N 116°55′27″W / 47.16028°N 116.92417°W / 47.16028; -116.92417,而该地的平均海拔
  • 吴中伟吴中伟(1918年7月20日-2000年2月4日),江苏省江阴市人,中国建筑材料与土木工程专家,中国工程院首批院士,是中国混凝土科学技术的主要奠基人之一。1918年7月出生于张家港市南沙镇七房
  • 无依之地《无依之地》(英语:Nomadland)是一部美国独立剧情片,由赵婷编剧和执导。弗朗西丝·麦克多曼德、大卫·史崔森、琳达·梅、夏琳·斯旺基和鲍勃·威尔斯主演。该片根据2017年杰西
  • 金马影史纪录列表金马影史纪录列表是金马奖历届得奖者至2020年11月第57届金马奖得奖名单公布后所做的统计。最佳造型设计: 1986、1991、2000、2013、2017 最佳剪辑: 1995、2001最佳女配角: 1990最佳女配角: 1976最佳导演: 1986、2008、2017最佳原著剧本: 1986、1996、2017最佳改编剧本: 1995、2015
  • 露西·德斯蒙德露西·德斯蒙德(英语:Lucy Desmond,1899年4月17日-1992年8月),英国女子竞技体操运动员。她曾代表英国获得1928年夏季奥运会体操比赛女子团体全能铜牌。她于1992年在萨里郡去世。
  • 佩德罗·罗沙佩德罗·罗沙(Pedro Virgilio Rocha Franchetti,1942年12月3日-2013年12月2日),乌拉圭足球运动员,乌拉圭国家足球队成员。从1961年到1974年,他共为乌拉圭国家足球队出场54次,打进17球。