使用有符号类型的无符号比较 – 搞英语 → 看世界

现代软件中有两种主要类型的固定精度整数：无符号和有符号。在 C++20 及更高版本中，有符号整数必须使用二进制补码约定。其他编程语言通常也指定二进制补码。

二进制补码是一种用二进制表示有符号整数的方法，其中最左边的位用作符号位 – 0 表示正数，1 表示负数 – 允许计算机通过简单的算术有效地处理正值和负值。正数被写成标准二进制（例如，8 位中的 5 为 00000101），而负数则通过取正数版本、翻转所有位（补码）并加 1 来形成（例如，-5 从 00000101 变为 11111011）。

在某些情况下，您已经有符号类型并且希望使用无符号比较。它发生在 Java（缺少无符号类型）和某些 x64 SIMD 指令集中：x64 架构的扩展，允许单个指令同时对多个数据元素执行相同的操作。

因此，您希望任何负值都大于任何正值。诀窍是简单地利用算术运算通常在硬件中进行环绕的事实。令M为最小可能值（非常小的负数），并采用两个有符号整数x和y ，则 ( x + M ) < ( y + M ) 相当于比较x和y ，就好像它们已转换为无符号整数值一样。

要了解为什么会这样，请考虑x到x + M的变换将 0 映射到M （因此 0 成为最小值）。它将所有正值映射到从 1 到 – M -1 的范围到从M+ 1 到– 1 的范围（因此正数变为负数）。负值全部溢出，最后一位变成零，而其他位保持不变。因此，它将从M到 -1 的负值映射到 0 到-M- 1 的范围（因此负数变为正数）。

不幸的是，它通常不适用于 C 或 C++，因为有符号溢出会导致未定义的行为。然而，如果您使用内部函数（SIMD 爱好者使用的特殊函数）为 SIMD 指令集编写代码，它就会起作用。它也适用于其他编程语言。

原文： https://lemire.me/blog/2025/03/24/unsigned-comparisons-using-signed-types/