语言冗余

✍ dations ◷ 2025-09-19 05:38:38 #语言冗余

语言学中的冗余(英语:Redundancy),也译作羡余、多余、剩余,是由信息论引入的术语,指在理解或识别语言单位时重复出现的非必要特征。

冗余信息通常比较容易预测,信息熵较低,很多时候可以脱离具体语境猜到冗余的信息,例如汉语短语“电话码”可以很容易猜到中间缺“号”。语言考试中的选词填空也一定程度上基于语言冗余现象,考生可以通过所学知识和语境中自然语言的冗余信息推测缺失的内容。

虽然在修辞学和文学创作中并不提倡语言的冗余,但在音系学上冗余凭借其可预测性和规律性在节奏和韵律方面有着突出作用,许多歌谣都会运用冗余修辞。

虽然冗余在语言中是相当普遍的现象,语言学的各种领域都可以见到冗余现象,但学者对于冗余并没有统一的定义。例如弗兰克·史密斯和肯·古德曼(英语:Ken Goodman)都是研究阅读中的冗余,二者观点可以概括为“只要信息被不止一个来源复制,就会出现冗余”。同时对信息论研究者,定义冗余也比较困难,例如爱德华·科林·切尔瑞(英语:Colin Cherry)提到“在信息论中,冗余通常经过数理整理,生成的语法不是按照语言学家惯用的方式,而是通过条件概率集合描述”,但他也认为语言结构之间的关系非常复杂,各种语言结构中构建冗余的方法各有不同。语法上的冗余研究起步较早,其定义主要和可预测性相关,但与之相对语义冗余更多与重复联系在一起。

早在魏晋时期,经学家王肃就注意到汉语中的冗余现象,他认为《左传》中“郑,伯男也;而使从公侯之贡,惧弗给也”一句的“伯男”“公侯”实际上指示“伯”“公”的意思,称之为“足句辞”,此后的经学家大多没有从语言学的角度解读这一现象;1930年代,黄侃、杨树达、黎锦熙分别用“配字”、“连及”、“复词偏义”概括古文中的这种现象,“偏义复词”至今仍是汉语语言学的常用术语。

西文中的“冗余”(Redundancy)最早出自香农的信息论,借以只带信息传递过程中超出最少需要量的那部分信息。根据信息论,由于现实中会存在噪声等因素干扰信息的传递,因此说话人在向听众讲话时传递多余的信息是有必要的,听众可以通过多余的信息避免信息丢失,这也有利于听众对于说话人所传递信息的理解与反馈。在语言学界,爱德华·科林·切尔瑞(英语:Colin Cherry)、莫里斯·哈勒(英语:Morris Halle)和罗曼·雅各布森在1953年的论文中最早以俄语为例论及语言学中的冗余现象。

中国大陆学术界使用“羡余”这一术语主要受到了赵元任和西方学术界的影响,从1980年代开始采用新术语“羡余”讨论汉语中“表达形式大于或超出语义内容”的语言现象。赵元任在1956年的英文论文《汉语结构各层次间形态与意义的脱节现象》(Formal and Semantic Discrepancies Between Different Levels of Chinese Structure)和英文著作《中国话的语法》(A Grammer of Spoken Chinese)中提及了汉语中的冗余现象。中国大陆学术界在1980年代开始从国际上引入这一概念,最初的外语研究者大多把这一术语翻译为“冗余”,而汉语研究则在李荣和朱德熙首倡下大多使用“羡余”替代“冗余”,因为汉语中“冗余”有多余不必要的贬义,但汉语中成分的重复有其必要性。此外还有少数使用“多余”“剩余”翻译这一术语。

学术上冗余和赘余存在区别,如果某一成分虽然并没有增加实际的语义,但在语用上起到了抵抗信息干扰、促进读者理解等作用,那么就不应该将这一部分视作赘余。在汉语中,羡余主要起到强调语素、协调音节的作用。有观点认为判断某些成分归于羡余还是赘余则一定程度上取决于人们对其的接受程度,例如社会上就“凯旋而归”存在长期争议,1982年中国电大考题、1999年《联合早报》文章都曾判定“凯旋而归”为病句引起反驳。通常在写作中,尤其是技术写作中,会比较推崇行文简洁而不重复,但也有人会区分羡余的重复和赘余的重复,例如计算机学家高德纳就鼓励写作者“再说一遍,正反互补,尤其是在给出定义的时候,这样有助于促进读者的理解”。

冗余现象在语法的任何层级都有可能发生。在许多语言中,基于语义的一致性要求,不同词汇在短语或句子中会协调调整形式,在这一过程中相同语法信息可能会重复多次。以西班牙语的“绿树”(los árboles verdes)的屈折变化为例,短语中冠词“los”、名词“árboles”、形容词“verdes”都采用复数形式,重复表示了这一词组指代复数。在音系学中,最小对立体是指某一对字词在某一音系中存在唯一的音位差异。然而很多时候音位的差异具有多重音系学特征,例如英语中的最小对立体“pin”和“bin”不仅仅有清浊对立,还有送气不送气、声带振动不振动等差异,单独来看每一种特征都足以区分英语中的/p/和/b/。

生成文法利用冗余规则简化描述语法的形式,例如如果上文提及的“pin”和“bin”中清浊对立可以提示送气不送气和声带紧张程度,那么语法分析中就不需要提及可以被提示的特征;另一方面,音系学用区别性特征(英语:distinctive feature)指代那些必要而必须提及的特征。在词法层面也存在着冗余现象,例如协同发音(英语:coarticulation)和语音同化这类音系学上有条件的语音交替现象,这类语音规则一定程度上有利于消除口语的含糊不清。正如斯蒂芬·平克所言:“在我们理解对话的过程中,语音规则的冗余弥补了某些语音歧义问题。例如,当听者听到‘thisrip’的时候,也许能知道‘thisrip’应该是‘this rip’而不是‘the srip’,因为在英语中并没有复辅音‘sr’开头的单词。”

相关

  • 后缀后缀(英语:suffix),又称字尾或词尾,在词汇学的定义中表示一种后置于其他词素后的词缀。以英语为例:establish(动词)+ -ment(后缀)→establishment(名词):借由后缀-ment的使用,使原本的动词
  • 索契索契(俄语:Сочи、亚美尼亚语:Սոչի, 格鲁吉亚语:სოჭი,拉丁字母转写:Sochi),另译素溪,俄罗斯联邦克拉斯诺达尔边疆区与阿布哈兹接界处、黑海沿岸,是俄罗斯受欢迎的渡假胜地
  • 马保定马保定(Malcolm Brodie)是加拿大卑诗省第4大城市列治文市市长。马保定1977年从不列颠哥伦比亚大学取得商学与法学双学位,于1996年作为一名律师以列治文非党联盟(RNPA)候选人身份
  • 帕普斯面积定理帕普斯面积定理(英语:Pappus's area theorem)描述为连接任意三角形三边形成三个平行四边形区域之间的关系。该定理也可以被认为是毕氏定理的推广,以发现者希腊数学家帕普斯命名
  • 承霖承霖(1864年-1903年),爱新觉罗氏,正蓝旗人,清朝政治人物、同进士出身。光绪二十年(1894年),参加光绪甲午科殿试,登进士三甲75名。同年五月,以主事分部学习。
  • 宦乡宦乡(1910年11月-1989年2月),男,贵州遵义人,中华人民共和国外交官。宦乡1932年自上海交通大学肄业后,曾前往日本、英国留学。回国后任职于武汉、宜昌、上海等地海关。抗日战争期间
  • 冯兰芳冯兰芳(1965年11月-),女,甘肃武威人,盲人曲艺演员,第二批中国国家级非物质文化遗产项目凉州贤孝代表性传承人,1972年拜师于贤孝艺人冯光生、陈虎全。
  • 家里蹲家里蹲(日语:ひきこもり;英语:social withdrawal)泛指长期隐居在家等地方,不出头露面。家里蹲在日本是一种严重的社会现象,绝大多数家里蹲,他们逃避社会,隐蔽于卧室之中,有时长达几年之久。 医生们正在努力避免“家里蹲”对下一代造成重要影响。日本卫生部把家里蹲定义为超过半年不接触社会、不上学、不上班,不与外人交往,生活自我封闭。家里蹲(又叫“蛰居者”,俗称“茧居族”、“隐蔽人士”、“关门族”、“家里蹲”),指人处于狭小空间、不出社会、不上学、不上班,过着内向的生活。“隐蔽”一般是指拒绝沟通、参
  • 罗桑丹贝尼玛罗桑丹贝尼玛(1744年-1807年)藏族,凉州乃亥央人,第二世(不计追认)智合仓活佛。罗桑丹贝尼玛于1744年生于凉州乃亥央。后来成为第二世(不计追认)智合仓活佛,为瞿昙寺寺主。1793年出任塔尔寺第三十六任法台。1807年,罗桑丹贝尼玛圆寂。
  • 析取范式在布尔逻辑中,析取范式(DNF)是逻辑公式的标准化(或规范化),它是合取子句的析取。作为规范形式,它在自动定理证明中有用。一个逻辑公式被认为是 DNF 的,当且仅当它是一个或多个文字的一个或多个合取的析取。同合取范式(CNF)一样,在 DNF 中的命题算子是与、或和非。非算子只能用做文字的一部分,这意味着它只能领先于命题变量。例如,下列公式都是 DNF:但如下公式不是 DNF:把公式转换成 DNF 要使用逻辑等价,比如双重否定除去、德·摩根定律和分配律。注意所有逻辑公式都可以转换成析取范式。但是,在某些情