int i = 3;
i = i++;
cout << i;
结果是什么?有人可能会说是3,也有人可能会说是4,更多的人在骂出题的人白痴,但这语句究竟有何问题呢?未必每个人都清楚。
有些人也许马上会说,这是“未定义行为”。没错,这是一个典型的未定义行为。i = i++这个表达式合乎语法,能够顺利编译通过,但是执行的结果,标准说“未定义”。为什么是“未定义”,深究起来,要从序列点说起。
序列点是程序中这样的一些点:通俗地说,执行至此,之前的语句都已经彻底执行干净执行完了,之后的语句还完全没开始执行;更常见、更严谨但略晦涩的说法是,之前的语句对现场环境的改变已经全部完成,之后的语句对现场环境的改变还没有开始。啥是现场环境呢?就是程序执行到某一点的那个状态,包括变量的内容、文件的内容等。
这跟最开始那个例子有什么关系呢?关键的问题来了:标准规定,两个序列点之间,程序执行的顺序可以是任意的。没错,正如你猜的那样,标准规定一个完整的表达式结束之后有一个序列点,而例子中i = i++是位于两个序列点之间的。编译器可以先算完i++,再写结果给i,也可以先将i = i,再令i++.按前面的方法算,i先自增变为4,然后i++返回3,于是i被赋值为3;按后一种方法算,i先被赋值为3,随后自增变成4.标准说了,这两种处理方法,编译器你爱选那种就选哪种,随便。如果谁写的程序像这样依赖执行的顺序,让他自己哭去!
等等,有人要问了,++的优先级难倒不是高于=吗?显然应该先执行++啊。这里有个概念的问题,前一段说的编译器先算i = i,绝不是说令=的优先级比++还高了。如果那样的话,表达式将变成 (i = i)++,也就是i.operator = (i)。 operator ++,执行++的主体变成i = i这个表达式的返回值了。上一段所说的先计算i = i,实际上还是先计算i++,只不过是先返回了i的值,然后推迟了将i自增1的操作先去干别的(i = i)去了,回头再来给i自增1.
——“什么,你说先干别的就先干别的,凭什么!”
嗯,我再重复一遍,标准规定,两个序列点之间,程序执行的顺序可以是任意的。
——“不是吃饱了撑的嘛,标准搞这个干啥?严格按照顺序执行不就完了嘛”。
C++标准弄这么复杂自然是有道理的。C++是极为重视执行效率的语言,这样做给了编译器优化的空间。比如考虑
int j = i++;
如果非得把i++执行干净了再干别的,那就不得不 temp = i; i += 1; j = i; .如果允许编译器打乱顺序执行呢,直接 j = i; i +=1; 就好了,省了一个temp倒一次的过程。
多说一句,一些更高层的语言,不是像C++这种极为重视效率的,比如,上面的例子就完全没有问题。完全不允许你编译器乱搞,上面那个例子,在Java中一定是先把i++彻底执行干净了返回3,再进行赋值,赋值完之后不会再有别的操作了,所以结果一定是3.
如何避免由序列点造成的这种未定义行为,有一句经典但有点晦涩的编程规则:“在相邻的两个序列点之间,一个对象只允许被修改一次,而且如果一个对象被修改则在这两个序列点之间只能为了确定该对象的新值而读一次”。其实明白了序列点具体是怎么回事,这个规则应该就很容易明白了。由于序列点之间程序执行顺序不确定,一个对象被修改多次的话最后留下的是哪次的结果就不确定。另外如果一个对象同时存在读取和修改,只有根据读取的结果来修改才是合法的,否则就会出现是先改完再读还是先读完再改的混乱。
最后再说一下最新的C++2003标准中定义的序列点(详细说明请参考标准):
·完整声明之后
·完整表达式之后
·进入函数时与退出函数时
·|| && ?: , 四个操作符的第一个操作数之后
最后一个似乎有点奇怪,为啥 + - 操作符之前就没有序列点,|| &&之前就有呢?a+b之间没有序列点而a||b之间就有,不公平啊。
嗯,你猜的没错,是为了短路。
不过要是手建重载了默认的||和&&,他们可就视同普通函数,不会在第一个操作数之后有序列点了,切记。