语言冗余

✍ dations ◷ 2025-11-20 00:34:10 #语言冗余

语言学中的冗余(英语:Redundancy),也译作羡余、多余、剩余,是由信息论引入的术语,指在理解或识别语言单位时重复出现的非必要特征。

冗余信息通常比较容易预测,信息熵较低,很多时候可以脱离具体语境猜到冗余的信息,例如汉语短语“电话码”可以很容易猜到中间缺“号”。语言考试中的选词填空也一定程度上基于语言冗余现象,考生可以通过所学知识和语境中自然语言的冗余信息推测缺失的内容。

虽然在修辞学和文学创作中并不提倡语言的冗余,但在音系学上冗余凭借其可预测性和规律性在节奏和韵律方面有着突出作用,许多歌谣都会运用冗余修辞。

虽然冗余在语言中是相当普遍的现象,语言学的各种领域都可以见到冗余现象,但学者对于冗余并没有统一的定义。例如弗兰克·史密斯和肯·古德曼(英语:Ken Goodman)都是研究阅读中的冗余,二者观点可以概括为“只要信息被不止一个来源复制,就会出现冗余”。同时对信息论研究者,定义冗余也比较困难,例如爱德华·科林·切尔瑞(英语:Colin Cherry)提到“在信息论中,冗余通常经过数理整理,生成的语法不是按照语言学家惯用的方式,而是通过条件概率集合描述”,但他也认为语言结构之间的关系非常复杂,各种语言结构中构建冗余的方法各有不同。语法上的冗余研究起步较早,其定义主要和可预测性相关,但与之相对语义冗余更多与重复联系在一起。

早在魏晋时期,经学家王肃就注意到汉语中的冗余现象,他认为《左传》中“郑,伯男也;而使从公侯之贡,惧弗给也”一句的“伯男”“公侯”实际上指示“伯”“公”的意思,称之为“足句辞”,此后的经学家大多没有从语言学的角度解读这一现象;1930年代,黄侃、杨树达、黎锦熙分别用“配字”、“连及”、“复词偏义”概括古文中的这种现象,“偏义复词”至今仍是汉语语言学的常用术语。

西文中的“冗余”(Redundancy)最早出自香农的信息论,借以只带信息传递过程中超出最少需要量的那部分信息。根据信息论,由于现实中会存在噪声等因素干扰信息的传递,因此说话人在向听众讲话时传递多余的信息是有必要的,听众可以通过多余的信息避免信息丢失,这也有利于听众对于说话人所传递信息的理解与反馈。在语言学界,爱德华·科林·切尔瑞(英语:Colin Cherry)、莫里斯·哈勒(英语:Morris Halle)和罗曼·雅各布森在1953年的论文中最早以俄语为例论及语言学中的冗余现象。

中国大陆学术界使用“羡余”这一术语主要受到了赵元任和西方学术界的影响,从1980年代开始采用新术语“羡余”讨论汉语中“表达形式大于或超出语义内容”的语言现象。赵元任在1956年的英文论文《汉语结构各层次间形态与意义的脱节现象》(Formal and Semantic Discrepancies Between Different Levels of Chinese Structure)和英文著作《中国话的语法》(A Grammer of Spoken Chinese)中提及了汉语中的冗余现象。中国大陆学术界在1980年代开始从国际上引入这一概念,最初的外语研究者大多把这一术语翻译为“冗余”,而汉语研究则在李荣和朱德熙首倡下大多使用“羡余”替代“冗余”,因为汉语中“冗余”有多余不必要的贬义,但汉语中成分的重复有其必要性。此外还有少数使用“多余”“剩余”翻译这一术语。

学术上冗余和赘余存在区别,如果某一成分虽然并没有增加实际的语义,但在语用上起到了抵抗信息干扰、促进读者理解等作用,那么就不应该将这一部分视作赘余。在汉语中,羡余主要起到强调语素、协调音节的作用。有观点认为判断某些成分归于羡余还是赘余则一定程度上取决于人们对其的接受程度,例如社会上就“凯旋而归”存在长期争议,1982年中国电大考题、1999年《联合早报》文章都曾判定“凯旋而归”为病句引起反驳。通常在写作中,尤其是技术写作中,会比较推崇行文简洁而不重复,但也有人会区分羡余的重复和赘余的重复,例如计算机学家高德纳就鼓励写作者“再说一遍,正反互补,尤其是在给出定义的时候,这样有助于促进读者的理解”。

冗余现象在语法的任何层级都有可能发生。在许多语言中,基于语义的一致性要求,不同词汇在短语或句子中会协调调整形式,在这一过程中相同语法信息可能会重复多次。以西班牙语的“绿树”(los árboles verdes)的屈折变化为例,短语中冠词“los”、名词“árboles”、形容词“verdes”都采用复数形式,重复表示了这一词组指代复数。在音系学中,最小对立体是指某一对字词在某一音系中存在唯一的音位差异。然而很多时候音位的差异具有多重音系学特征,例如英语中的最小对立体“pin”和“bin”不仅仅有清浊对立,还有送气不送气、声带振动不振动等差异,单独来看每一种特征都足以区分英语中的/p/和/b/。

生成文法利用冗余规则简化描述语法的形式,例如如果上文提及的“pin”和“bin”中清浊对立可以提示送气不送气和声带紧张程度,那么语法分析中就不需要提及可以被提示的特征;另一方面,音系学用区别性特征(英语:distinctive feature)指代那些必要而必须提及的特征。在词法层面也存在着冗余现象,例如协同发音(英语:coarticulation)和语音同化这类音系学上有条件的语音交替现象,这类语音规则一定程度上有利于消除口语的含糊不清。正如斯蒂芬·平克所言:“在我们理解对话的过程中,语音规则的冗余弥补了某些语音歧义问题。例如,当听者听到‘thisrip’的时候,也许能知道‘thisrip’应该是‘this rip’而不是‘the srip’,因为在英语中并没有复辅音‘sr’开头的单词。”

相关

  • 晋剧晋剧是中国北方的一个重要戏曲剧种,流传于山西省中北部,内蒙古中部,陕西北部以及河北省西部地区,大致上是晋语的并州片,吕梁片,张呼片地区以及大包片,五台片的部分地区。因起源于山
  • 嵩阳书院嵩阳书院,是宋代四大书院之一,在河南嵩山南麓,今登封市北约三公里处,北依嵩山主峰峻极峰,南对双溪河。是河南省省级重点文物。最早为佛教、道教庙宇,宋代成为儒家书院。儒家理学大
  • 美国教育部美国教育部(英语:United States Department of Education,缩写:ED),是美国联邦政府主管联邦教育行政事务的行政部门。1979年10月17日,吉米·卡特总统签署生效《教育部组织法》(Depa
  • X算法在计算机科学中,X算法可用来求解精确覆盖问题。此名称最早在高德纳的论文《舞蹈链》中出现,他认为此算法是“试错法中最显而易见”的。 就技术而言,X算法是一个深度优先的不确
  • 林灿林灿(1943年5月-),广西上思人,中华人民共和国政治人物。毕业于广西农学院植保系植保专业。1984年,任广西隆安县委副书记、县长。1990年,任广西南宁地委委员、行署常务副专员。1993
  • 王晓明 (1955年)王晓明(1955年6月-),男,浙江义乌人,中华人民共和国作家、文艺理论家。1977年,考入华东师范大学中文系读本科,1979年转读该系中国现代文学专业的硕士研究生,师从许杰和钱谷融,1982年获
  • 言论自由区言论自由区(英语:Free speech zones,又称第一修正案区、言论自由笼和抗议区)是设置在美国公共场所中的政治抗议区域。《美国宪法第一修正案》规定,国会不得立法剥夺人民和平集会
  • 江味农江味农(1872年-1938年),谱名忠业,名杜,字味农,以字行。号定翁,法名妙熙、胜观。江苏金陵人。民初知名佛教居士,出入禅宗、莲宗、密宗。幼时读儒家经典,曾中孝廉。1918年开始研习佛法,听
  • 保罗·埃鲁保罗·埃鲁(Paul Louis Toussaint Héroult) (1863年4月10日-1914年5月9日)是一位法国化学家。保罗·埃鲁是一个制革工人的儿子,在16岁时就阅读了当时正在卡昂访问的德维尔于1854年在巴黎完成的著作《铝及其性质..》(De l'aluminium, ses propriétés ..)。德维尔在1854年首次制得铝,但德维尔的制铝方法非常昂贵。从此埃鲁便有了降低制铝成本的想法。埃鲁从巴黎的圣巴比学院(Collège Sainte-Barbe)毕业后回到了卡昂帮助父亲照
  • 熊徇熊徇(?-前800年),亦称熊季徇,熊霜之季弟,熊严之子。熊霜六年(前822年),去世,三弟争立。仲雪死;叔堪避难于濮,少弟季徇立,是为熊徇。熊徇十六年,郑桓公初封于郑。二十二年,熊徇卒。《清华大学藏战国竹简》《楚居》上名为熊训。周 → 秦 | 吴 | 姜齐 → 田齐 | 鲁 | 燕 | 蔡 | 曹 | 陈 | 杞 | 卫 | 宋 | 晋 → 赵 / 魏 / 韩 | 楚 | 越 | 郑 | 滕 | 许 | 薛 | 邾 | 莒