关于符号位扩展你又知道多少 · 那些年，一起追过的算法

转载请注明出处 http://blog.csdn.net/pony_maggie/article/details/37535577 作者:小马先看两段代码, 一个是C，一个是java。 ~~~ int _tmain(int argc, _TCHAR* argv[]) { char b = 0x83; short s1 = (short)b; short s2 = (short)(b&0xff); printf("s1 = %d\n", s1); printf("s2 = %d\n", s2); return 0; } ~~~ ~~~ public static void main(String[] args) { byte b = (byte)0x83; short s1 = (short)b; short s2 = (short)(b&0xff); System.out.printf("s1 = %d\n", s1); System.out.printf("s2 = %d\n", s2); } ~~~ 运行结果其实是一样的: s1 = -125 s2 = 131 用两种语言，是想说明它的通用性，表示这个特性跟语言本身无关。那么原因是什么呢？首先，第二个结果才是我们期望的，这个应该都同意(至少大部分情况下都是这样)。其次如果变量b是正数(这里是负数，因为char表示有符号数，0x83最高位是1,表示负数)，S1和S2的结果是相等的。所以，问题的核心其实还是变量b的这个符号位。计算机里从低精度数向高精度数转换时，比如这里从char到short, 肯定会在前面扩展一些bit位，从而达到高精度数的长度。那么扩展时，是补0还是补1呢？这里有个原则就是，有符号数扩展符号位，也就是1,无符号数扩展0。再看看上面的代码，s1其实是0xff83, 是个负数，它表示的值就是-125(注意0xff83是补码表示，计算原值要换成原码)。而s2是0x0083, 因为它强制与上了0xff,其实就是与上了0x00ff。这样就把高字节转成了0x00,消除了符号位。为了证明上面的理论，可以做一个实验，把代码改成这样： ~~~ int _tmain(int argc, _TCHAR* argv[]) { char b = 0x83; short s1 = (short)b; short s2 = (short)(b&0xffff); printf("s1 = %d\n", s1); printf("s2 = %d\n", s2); return 0; } ~~~ 运行，结果是s1=s2=-125。这也支持了上面的理论分析。趁热打铁，再看一个示例： ~~~ int _tmain(int argc, _TCHAR* argv[]) { char a = 0xff; if (a == 0xff) { printf("equal\n"); } return 0; } ~~~ 运行的结果是, “equal”并没有打印出来。你可能已经分析出原因了。字符a在和0xff比较时，被隐式的转换成int(因为0xff是整型)，然后a做了符号位扩展，变为0xffffffff, 这个值和0x000000ff比较，当然是不等的。我希望已经讲清楚了，欢迎拍砖。