现代软件中有两种主要类型的固定精度整数:无符号和有符号。在 C++20 及更高版本中,有符号整数必须使用二进制补码约定。其他编程语言通常也指定二进制补码。
二进制补码是一种用二进制表示有符号整数的方法,其中最左边的位用作符号位 – 0 表示正数,1 表示负数 – 允许计算机通过简单的算术有效地处理正值和负值。正数被写成标准二进制(例如,8 位中的 5 为 00000101),而负数则通过取正数版本、翻转所有位(补码)并加 1 来形成(例如,-5 从 00000101 变为 11111011)。
在某些情况下,您已经有符号类型并且希望使用无符号比较。它发生在 Java(缺少无符号类型)和某些 x64 SIMD 指令集中:x64 架构的扩展,允许单个指令同时对多个数据元素执行相同的操作。
因此,您希望任何负值都大于任何正值。诀窍是简单地利用算术运算通常在硬件中进行环绕的事实。令M为最小可能值(非常小的负数),并采用两个有符号整数x和y ,则 ( x + M ) < ( y + M ) 相当于比较x和y ,就好像它们已转换为无符号整数值一样。
要了解为什么会这样,请考虑x到x + M的变换将 0 映射到M (因此 0 成为最小值)。它将所有正值映射到从 1 到 – M -1 的范围到从M+ 1 到– 1 的范围(因此正数变为负数)。负值全部溢出,最后一位变成零,而其他位保持不变。因此,它将从M到 -1 的负值映射到 0 到-M- 1 的范围(因此负数变为正数)。
不幸的是,它通常不适用于 C 或 C++,因为有符号溢出会导致未定义的行为。然而,如果您使用内部函数(SIMD 爱好者使用的特殊函数)为 SIMD 指令集编写代码,它就会起作用。它也适用于其他编程语言。
原文: https://lemire.me/blog/2025/03/24/unsigned-comparisons-using-signed-types/