关系运算符

✍ dations ◷ 2025-11-30 10:32:35 #计算机编程

关系运算符在计算机科学的编程语言中，是测试或定义两个实体之间某种关系的构造或操作符。这些包括数值等式和不等式（例如 5 = 5 和 4≥3）。在具备布尔类型的编程语言中（如 Pascal，Ada 或 Java），这些运算符通常根据两个操作变量之间的条件关系是否成立，判定为真或假。诸如 C 语言中关系运算符返回整数 0 或 1，其中 0 表示假，任何非零值表示真。使用关系运算符创建的表达式，形成所谓的关系表达式或条件。关系运算符可以被视为谓词逻辑的特殊情况。

在许多编程语言构造和数据类型中都使用到相等性，它用于测试元素是否已存在于集合中，或者借由键来访问值。它在切换（switch）语句，以及编程的逻辑并联过程中，用于将控制流调度到正确的分支。相等性的可能含义之一是“如果 a 等于 b，那么我们可以在任何上下文中互换 a 或 b，而不会产生任何差异。但这样的声明不一定成立，尤其在可变性和内容等同性一起考虑时。

有时，特别是在面向对象编程中，对数据类型和继承对象进行比对时，出现了相等性和辨别的问题。以下情况通常需要区别：

在许多现代编程语言中会借由引用来访问对象和数据结构。在这些语言中，需要测试两种相等性质：

第一种同等性质通常蕴涵着第二种同等性质（除了非数字类（not a number, NaN），它们不等于自身），但反向的同等性质并不一定成立。例如两个字符串对象可以是不同对象（第一种意义不相等），但它们包含相同的字符序列（第二种意义上相等）。有关此问题的更多信息，请参阅识别（identity）。

实数中包括许多简分数，无法以浮点算数精确地表示，所以需要在给定误差范围内来测试相等性。但这样的误差范围将打破一些例如传递性、反身性的要求性质：IEEE浮点标准是判断 Nan ≠ NaN 成立（NaN不等于自身）。

其他编程元素例如可计算的函数，可能没有相等性的意义，或者相等性是不能计算的。由于这些原因，一些语言以基类、接口、特点（trait）或协议的形式，定义了“可比较”的明确概念，以源码中的显式声明，被借由类型的结构，来使用关系运算。

JavaScript，PHP 和一些其它动态类型的语言中，如果两个值相等，等号运算符将计算为真，即使它们实际上为不同类型的对象，例如以数值4和字符串"4"相比较，结果会是相等。在这类语言中通常也会提供类型相等运算符，仅对具有相同或等价类型的对象比较返回真（在PHP 5中 4 ==="4"为假，但 4 =="4" 为真）。而在将数值0也当作布尔值为假的编程语言中，该运算符可化简为检查对象是否为数值零（例如，对于数值0或字符串"0"的x对象，使用类型相等运算符，则 x == 0 判断传回真值）。

非数值数据的次序比较（大于或小于）运算是根据排序惯例（例如字符串依照编程语言内定的字典次序，和/或可由开发人员设置的）。当两个数据项 a 和 b 之间的比较结果，要和数值关系时，通常惯例是如果 a < b 则结果赋值为 -1，如果 a = b 则为 0，如果 a > b 则为 1。例如C语言的函数strcmp运行三方向比较，并根据此惯例返回 -1, 0 或 1，而qsort预期比较函数依此惯例返回值。在排序算法中比较方法源码的效率至为关键，因为它是排序性能的主要因素之一。

开发人员定义的数据类型（不是编程语言内置的类型）的比较，可以编写自定义的或使用库的函数（如上文的strcmp）来运行，或者在某些语言中通过重载比较运算符-即以开发人员的定义指派给比较运算符，来比较特定数据类型。另一个选择是使用某些惯例，例如成员比较。

虽然一开始可能不那么显而易见，像布尔逻辑运算符 XOR，AND，OR 和 NOT，这些关系运算符可以设计为具有逻辑等同性，使得它们都可以相互定义。对于任何给定的 x 和 y 值，以下四个条件语句都有相同的逻辑等价性 E（全为真或全为假）：

这依赖于域是良好排序的。

在编程语言中最常见到的数值关系运算符如下所示。

其他较少见的：Common Lisp的不等关系运算符是 /=，Macsyma/Maxima 的不等关系运算符是 #。旧的Lisp使用equal，greaterp 和 lessp; 而以not运算符作逻辑否定。

关系运算符也用于技术文献而不是单词，如果编程语言支持通常以中缀表示法，亦即出现在其操作变量（两个表达式是相关的）之间。举例而言如果 x 小于 y，在Python中的表达式将印出句子：

if x < y:    print("x is less than y in this example")

其他编程语言如 Lisp 使用前缀表示法，如下所示：

(>= X Y)

操作符链接

链接关系在数学中是普遍的写法，例如 3 < x < y < 20 表示 3 < x 而且 x < y 而且 y <20。语义是很清楚的，因为数学中这些关系运算是有传递性的。然而，许多最近的编程语言会把 3 < x < y 的表达式，看作两个左（或右）关系运算符的组合，而解译为(3 < x ) < y。如果我们设 x = 4 则得到(3 < 4 )< y，而表达式变成true < y，这是无意义的。但它却可能通过 C/C++ 和一些其它语言的编译（因为 true 会以数值1代表）。

有些编程语言如Python和Perl 6 能正确给出x < y < z表达式所代表的数学意义，其它种语言则不，部分是因大多数运算符在C语言种类中，以中缀表示法的运作方式有所不同。D编程语言保持与C的一些兼容性，而“允许C语言表达式却有微妙不同的语义（虽然可说是方向正确），与便利性比起来造成更多的混淆”。

有些语言如 Common Lisp，对此则使用多参数谓词。当在 1 和 10 之间时，评估比较表达式(<= 1 x 10)结果为真。

早期（公元1956-57年）FORTRAN编程语言受限于有限的字集，其中等号“=”是唯一的关系运算符。
没有数学上通用的大于“<”或小于“>”关系符号（当然也就没有不大于“≤”或不小于“≥”之类的关系符号），
迫使设计者定义如.GT.、.LT.、.GE.、.EQ.这样子的关系符号，随后等号“=”字符被人藉用来运行复制，
尽管此用法与数学意义明显不一致（X = X + 1 在数理是不能成立的）。

因此国际代数语言（IAL，ALGOL 58）和 ALGOL（1958和1960）引入了“:=”表示赋值操作，
留下等号“=”字符作为相等关系的标准，遵循这个惯例的编程语言有CPL，ALGOL W，ALGOL 68，BCPL，
Simula，SET（SETL），Pascal，Smalltalk，Modula-2，Ada，Standard ML，OCaml，Eiffel，Object Pascal（Delphi），Oberon，Dylan，VHSIC（VHDL）等。

大多数编程语言遵循的这种事实标准，后来被名为B的极简编译语言间接改变。它唯一的应用目标是作为
（一个非常原始的）Unix的最初移植版本，但它也演变成非常有影响力的 C 编程语言。

B 最初是系统编程BCPL的语法变体，简化（无类型）的CPL版本。在描述为 “拆解” 过程的情况下，
BCPL的交集和联集运算符被替换为&和|（后来变成&&和||）。

同样的过程中，原来具有ALGOL风格在BCPL语言中表示赋值操作的:=符号，在B语言中被替换为=。
导致这种演变过程的原因未知。由于变量赋值在B语言中没有特殊语法（例如 let 或类似），而在表达式中
允许这个操作，所以等号的传统语义（相等关系）和非标准涵义（变量赋值）另外相关系在一起。为了区分
这两种意义，因此Ken Thompson使用了特别的双等号==组合取代相等关系判断。

一个小的类型系统后来被引入，B接着演变成C。C语言的普及与Unix的关系，使Java，C＃和许多其他语言
沿用这种语法，虽然已经大不相同于等号的数学关系涵义。

C编程的赋值语句会有返回值，由于任何非零值在条件表达式中被解译为真，源码if(x = y)是合法的，
但与if(x == y)的意义完全相异。前者语义为“将 y 赋值给 x，如果 x 的新值不为 0，则运行以下语句”。
后者语义则为“如果仅当 x 等于 y，运行以下语句”。

  int x = 1;  int y = 2;  if (x = y) {      /* This code will always execute if y is anything but 0*/      printf("x is %d and y is %d\n", x, y);  }

虽然Java和C＃具有与C相同的运算符，但这种错误通常会导致这些编程的编译错误，
因为条件式必须是布尔类型，而且没有隐式方法能从其它类型（如数值）转为布尔类型。
因此除非被赋值的变量具有布尔类型（或包装为布尔类型），否则会产生编译错误。

ALGOL类的语言中例如Pascal，Delphi和Ada（允许其编程可定义嵌套函数），
Python和许多函数语言中，赋值运算符不可出现在表达式中（包括if子句），排除了这种错误。
一些编译器如GNU编译器集合（GCC），在编译if语句中包含赋值运算符的源码时，提供了警告，
虽然在if条件中可以有一些赋值的合法使用。在此情况下赋值语句必须以一对额外的括号特别声明，
以避免警告。

同样地，一些语言如BASIC使用“=”等号同时代表赋值操作和相等关系两者，因为在语法上
它们是分开的（如Pascal，Ada，Python等，赋值运算符不能出现在表达式中）。

有些程序员习惯于逆向（一般从左到右条件判断）写一个常量的比较：