大型语言模型

✍ dations ◷ 2025-09-12 18:18:28 #大型语言模型

大语言模型 (英语:large language model,LLM) 是一种语言模型,由具有许多参数(通常数十亿个权重或更多)的人工神经网络组成,使用自监督学习或半监督学习对大量未标记文本进行训练。大型语言模型在2018年左右出现,并在各种任务中表现出色。

尽管这个术语没有正式的定义,但它通常指的是参数数量在数十亿或更多数量级的深度学习模型。大型语言模型是通用的模型,在广泛的任务中表现出色,而不是针对一项特定任务(例如情感分析、命名实体识别或数学推理)进行训练。

尽管在预测句子中的下一个单词等简单任务上接受过训练,但发现具有足够训练和参数计数的神经语言模型可以捕获人类语言的大部分句法和语义。 此外大型语言模型展示了相当多的关于世界的常识,并且能够在训练期间“记住”大量事实。



相关

  • 心搏骤停心脏停止(Cardiac arrest)或称为心搏停止,是心脏因不能够有效收缩,而导致血液循环停止的现象,症状包含丧失意识(英语:Unconsciousness)、呼吸异常或中止(英语:respiratory arrest),有些
  • 北京丁香北京丁香(学名:)为木犀科丁香属的植物网脉丁香的亚种。分布于中国大陆的河北、甘肃、山西、陕西、河南、宁夏、四川、内蒙古等地,生长于海拔600米至2,400米的地区,见于山谷、疏林
  • 齐藤滋与史齐藤滋与史(日语:齊藤滋与史/さいとう しげよし,1918年8月9日-2018年8月9日)是日本的企业家、政治人物。父亲为企业家齐藤知一郎(日语:斉藤知一郎),是大昭和制纸的创办人。齐藤滋与史
  • 麦包麦包可以指:
  • 安陵氏安陵是中国历史上的罕见姓氏。战国时期封“安陵”君者有两人,一为楚国封君,名“坛”。根据《战国策·楚策一》,战国时期楚宣王将宠爱的大臣“坛”封于安陵,称安陵君;一为魏国封君
  • 勒斯佩河坐标:51°01′56″N 8°15′20″E / 51.032343°N 8.255539°E / 51.032343; 8.255539勒斯佩河(德语:Röspe),是德国的河流,位于该国西部,处于北莱茵-威斯特法伦州,属于埃德河的右支
  • 前18世纪前1800年至前1701年的这一段期间被称为前18世纪。
  • 耶莱娜·尼科利奇耶莱娜·尼科利奇-内纳迪奇(塞尔维亚语拉丁字母:Jelena Nikolić-Nenadić,塞尔维亚语西里尔字母:Јелена Николић-Ненадић,1982年4月13日-)生于贝尔格莱德,是一名塞尔维亚女子排球运动员,司职接应二传。她在职业生涯早期代表塞尔维亚和黑山参赛,获得2006年世界锦标赛铜牌。塞尔维亚和黑山解体后,她开始代表塞尔维亚参赛,期间曾获得2015年世界杯亚军、2016年里约奥运亚军。耶莱娜的丈夫Petar Nenadić是一名手球运动员,两人的儿子于2013年出生。
  • 花濑麻美花濑麻美(日语:花瀬 あさみ,11月18日-),日本女性配音员。出身于兵库县伊丹市。WISE PRODUCTION(日语:ワイスプロダクション)所属、NPO目高之小太郎剧团团长。旧艺名原 爱纱实(はら あさみ)。东京声优企划制作(日语:東京声優プロデュース)大阪校在校期间,担任网络电视声优Fighters的综合主持人。2019年7月1日起,将艺名原爱纱实改为花濑麻美。曾多次参与WISE PRODUCTION(日语:ワイスプロダクション)的“动画声优部目高之小太郎剧团”和“保护爱心与环境的儿童绘本剧场”的演
  • 子革然丹(?—?),字子革,中国春秋时期郑国的公孙,楚国的右尹。郑穆公之孙,子然之子。前554年,子然的同母兄弟公子嘉(子孔)执政独断专行,国人要追究西宫之难和纯门之战的罪责,公子嘉便带领自己的甲士和然丹、子良家的甲士保卫自己。八月十一,公孙舍之(子展)、公孙夏(子西)率领国人进攻,杀了公子嘉并瓜分他的家财和采邑。然丹、子良出奔楚国,子革为右尹。郑国人让公孙舍之当国,公孙夏听政,立子产做卿。前538年冬,吴国伐楚,沈尹射奔命于夏汭,咸尹宜咎固城于钟离,薳启彊固城于城巢,然丹固城于州来。前533年二月庚申,楚国